このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2019065263) 発音誤り検出装置、発音誤り検出方法、プログラム
国際事務局に記録されている最新の書誌情報    第三者情報を提供

国際公開番号: WO/2019/065263 国際出願番号: PCT/JP2018/033936
国際公開日: 04.04.2019 国際出願日: 13.09.2018
IPC:
G10L 15/10 (2006.01) ,G09B 19/00 (2006.01) ,G09B 19/06 (2006.01) ,G10L 15/32 (2013.01) ,G10L 25/60 (2013.01)
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
08
音声の識別または探索
10
未知音声と標準パタンとの距離または歪みを用いるもの
G 物理学
09
教育;暗号方法;表示;広告;シール
B
教育用または教示用の器具;盲人,聾者または唖者の教習,または意志を通じるための用具;模型;遊星儀;地球儀;地図;図表
19
このサブクラスの他のメイングループに包含されない教習
G 物理学
09
教育;暗号方法;表示;広告;シール
B
教育用または教示用の器具;盲人,聾者または唖者の教習,または意志を通じるための用具;模型;遊星儀;地球儀;地図;図表
19
このサブクラスの他のメイングループに包含されない教習
06
外国語
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
28
音声認識システムの構造上の細部
32
順次または並列に使用される複数の認識装置;スコアを組み合わせるシステム,例.投票システム
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25
G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声または声の分析手法
48
特定の用途に特に適合したもの
51
比較または判別のためのもの
60
音声の信号の質を測定するためのもの
出願人:
日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP/JP]; 東京都千代田区大手町一丁目5番1号 5-1, Otemachi 1-chome, Chiyoda-ku, Tokyo 1008116, JP
発明者:
小橋川 哲 KOBASHIKAWA, Satoshi; JP
増村 亮 MASUMURA, Ryo; JP
神山 歩相名 KAMIYAMA, Hosana; JP
井島 勇祐 IJIMA, Yusuke; JP
青野 裕司 AONO, Yushi; JP
代理人:
中尾 直樹 NAKAO, Naoki; JP
中村 幸雄 NAKAMURA, Yukio; JP
義村 宗洋 YOSHIMURA, Takahiro; JP
優先権情報:
2017-18500326.09.2017JP
発明の名称: (EN) PRONUNCIATION ERROR DETECTION DEVICE, METHOD FOR DETECTING PRONUNCIATION ERROR, AND PROGRAM
(FR) DISPOSITIF ET PROCÉDÉ DE DÉTECTION D'ERREUR DE PRONONCIATION, ET PROGRAMME
(JA) 発音誤り検出装置、発音誤り検出方法、プログラム
要約:
(EN) The present invention provides a pronunciation error detection device capable of following a text without the need for a correct sentence even when false recognition such as a reading error occurs. The pronunciation error detection device comprises: a speech recognition unit that recognizes the speech in speech data on the basis of a speech recognition model for a non-native speaker, and outputs speech recognition results, reliability, and time information; a reliability determination unit that outputs the speech recognition results with higher reliability than a predetermined threshold and the corresponding time information as the assessed speech recognition results and the assessed time information; and a pronunciation error detection unit that outputs a phoneme as a pronunciation error when the reliability for the phoneme in the speech recognition results using a speech recognition model for a native speaker under a weak constraint grammar is greater than the reliability of the corresponding phoneme in the speech recognition results using an acoustic model for a native speaker under a constraint grammar wherein the assessed speech recognition results are correct for the speech data in a segment designated by the assessed time information.
(FR) La présente invention concerne un dispositif de détection d'erreur de prononciation capable de suivre un texte sans qu'une phrase correcte soit nécessaire même lorsqu'il se produit une reconnaissance erronée telle qu'une erreur de lecture. Le dispositif de détection d'erreur de prononciation comprend : une unité de reconnaissance vocale qui reconnaît la parole dans des données vocales sur la base d'un modèle de reconnaissance vocale pour un locuteur non natif, et délivre des résultats de reconnaissance vocale, une fiabilité et des informations de temps ; une unité de détermination de fiabilité qui délivre en sortie les résultats de reconnaissance vocale avec une fiabilité supérieure à un seuil prédéterminé et les informations de temps correspondantes en tant que résultats de reconnaissance vocale évalués et informations de temps évaluées ; et une unité de détection d'erreur de prononciation qui délivre en sortie un phonème en tant qu'erreur de prononciation lorsque la fiabilité du phonème dans les résultats de reconnaissance vocale en utilisant un modèle de reconnaissance vocale pour un locuteur natif sous une contrainte grammaticale faible est supérieure à la fiabilité du phonème correspondant dans les résultats de reconnaissance vocale en utilisant un modèle acoustique pour un locuteur natif sous une contrainte grammaticale, les résultats évalués de reconnaissance vocale étant corrects pour les données vocales dans un segment désigné par les informations de temps évaluées.
(JA) 正解文が必須でなく、読み間違い等の誤認識が発生した場合にも追従が可能な発音誤り検出装置を提供する。非母国語話者音声認識モデルに基づいて音声データの音声認識を行い、音声認識結果とその信頼度とその時間情報とを出力する音声認識部と、予め設定された閾値より信頼度が高い音声認識結果および対応する時間情報を、判定後音声認識結果および判定後時間情報として出力する信頼度判定部と、判定後時間情報で指定される区間の音声データについて、低制約文法母国語話者音声認識モデルを用いた音声認識結果の音素ごとの信頼度が、判定後音声認識結果を正解とする文法制約下における母国語話者音響モデルによる音声認識結果の対応する音素の信頼度よりも大きくなる場合に、当該音素を発音誤りとして出力する発音誤り検出部を含む。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)