Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019065263) DISPOSITIF ET PROCÉDÉ DE DÉTECTION D'ERREUR DE PRONONCIATION, ET PROGRAMME
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/065263 N° de la demande internationale : PCT/JP2018/033936
Date de publication : 04.04.2019 Date de dépôt international : 13.09.2018
CIB :
G10L 15/10 (2006.01) ,G09B 19/00 (2006.01) ,G09B 19/06 (2006.01) ,G10L 15/32 (2013.01) ,G10L 25/60 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
08
Classement ou recherche de la parole
10
utilisant des mesures de distance ou de distorsion entre la parole inconnue et les gabarits de référence
G PHYSIQUE
09
ENSEIGNEMENT; CRYPTOGRAPHIE; PRÉSENTATION; PUBLICITÉ; SCEAUX
B
MATÉRIEL ÉDUCATIF OU DE DÉMONSTRATION; MOYENS D'ENSEIGNEMENT OU DE COMMUNICATION DESTINÉS AUX AVEUGLES, SOURDS OU MUETS; MODÈLES; PLANÉTAIRES; GLOBES; CARTES GÉOGRAPHIQUES; DIAGRAMMES
19
Enseignement non couvert par d'autres groupes principaux de la présente sous-classe
G PHYSIQUE
09
ENSEIGNEMENT; CRYPTOGRAPHIE; PRÉSENTATION; PUBLICITÉ; SCEAUX
B
MATÉRIEL ÉDUCATIF OU DE DÉMONSTRATION; MOYENS D'ENSEIGNEMENT OU DE COMMUNICATION DESTINÉS AUX AVEUGLES, SOURDS OU MUETS; MODÈLES; PLANÉTAIRES; GLOBES; CARTES GÉOGRAPHIQUES; DIAGRAMMES
19
Enseignement non couvert par d'autres groupes principaux de la présente sous-classe
06
Langues étrangères
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
28
Détails de structure des systèmes de reconnaissance de la parole
32
Reconnaisseurs multiples utilisés en séquence ou en parallèle; Systèmes de combinaison de score à cet effet, p.ex. systèmes de vote
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25
Techniques d'analyses de la voix ou de la parole qui ne se limitent pas à un seul des groupes G10L15/-G10L21/151
48
spécialement adaptées pour un usage particulier
51
pour comparaison ou différentiation
60
pour mesurer la qualité des signaux de voix
Déposants :
日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP/JP]; 東京都千代田区大手町一丁目5番1号 5-1, Otemachi 1-chome, Chiyoda-ku, Tokyo 1008116, JP
Inventeurs :
小橋川 哲 KOBASHIKAWA, Satoshi; JP
増村 亮 MASUMURA, Ryo; JP
神山 歩相名 KAMIYAMA, Hosana; JP
井島 勇祐 IJIMA, Yusuke; JP
青野 裕司 AONO, Yushi; JP
Mandataire :
中尾 直樹 NAKAO, Naoki; JP
中村 幸雄 NAKAMURA, Yukio; JP
義村 宗洋 YOSHIMURA, Takahiro; JP
Données relatives à la priorité :
2017-18500326.09.2017JP
Titre (EN) PRONUNCIATION ERROR DETECTION DEVICE, METHOD FOR DETECTING PRONUNCIATION ERROR, AND PROGRAM
(FR) DISPOSITIF ET PROCÉDÉ DE DÉTECTION D'ERREUR DE PRONONCIATION, ET PROGRAMME
(JA) 発音誤り検出装置、発音誤り検出方法、プログラム
Abrégé :
(EN) The present invention provides a pronunciation error detection device capable of following a text without the need for a correct sentence even when false recognition such as a reading error occurs. The pronunciation error detection device comprises: a speech recognition unit that recognizes the speech in speech data on the basis of a speech recognition model for a non-native speaker, and outputs speech recognition results, reliability, and time information; a reliability determination unit that outputs the speech recognition results with higher reliability than a predetermined threshold and the corresponding time information as the assessed speech recognition results and the assessed time information; and a pronunciation error detection unit that outputs a phoneme as a pronunciation error when the reliability for the phoneme in the speech recognition results using a speech recognition model for a native speaker under a weak constraint grammar is greater than the reliability of the corresponding phoneme in the speech recognition results using an acoustic model for a native speaker under a constraint grammar wherein the assessed speech recognition results are correct for the speech data in a segment designated by the assessed time information.
(FR) La présente invention concerne un dispositif de détection d'erreur de prononciation capable de suivre un texte sans qu'une phrase correcte soit nécessaire même lorsqu'il se produit une reconnaissance erronée telle qu'une erreur de lecture. Le dispositif de détection d'erreur de prononciation comprend : une unité de reconnaissance vocale qui reconnaît la parole dans des données vocales sur la base d'un modèle de reconnaissance vocale pour un locuteur non natif, et délivre des résultats de reconnaissance vocale, une fiabilité et des informations de temps ; une unité de détermination de fiabilité qui délivre en sortie les résultats de reconnaissance vocale avec une fiabilité supérieure à un seuil prédéterminé et les informations de temps correspondantes en tant que résultats de reconnaissance vocale évalués et informations de temps évaluées ; et une unité de détection d'erreur de prononciation qui délivre en sortie un phonème en tant qu'erreur de prononciation lorsque la fiabilité du phonème dans les résultats de reconnaissance vocale en utilisant un modèle de reconnaissance vocale pour un locuteur natif sous une contrainte grammaticale faible est supérieure à la fiabilité du phonème correspondant dans les résultats de reconnaissance vocale en utilisant un modèle acoustique pour un locuteur natif sous une contrainte grammaticale, les résultats évalués de reconnaissance vocale étant corrects pour les données vocales dans un segment désigné par les informations de temps évaluées.
(JA) 正解文が必須でなく、読み間違い等の誤認識が発生した場合にも追従が可能な発音誤り検出装置を提供する。非母国語話者音声認識モデルに基づいて音声データの音声認識を行い、音声認識結果とその信頼度とその時間情報とを出力する音声認識部と、予め設定された閾値より信頼度が高い音声認識結果および対応する時間情報を、判定後音声認識結果および判定後時間情報として出力する信頼度判定部と、判定後時間情報で指定される区間の音声データについて、低制約文法母国語話者音声認識モデルを用いた音声認識結果の音素ごとの信頼度が、判定後音声認識結果を正解とする文法制約下における母国語話者音響モデルによる音声認識結果の対応する音素の信頼度よりも大きくなる場合に、当該音素を発音誤りとして出力する発音誤り検出部を含む。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : japonais (JA)
Langue de dépôt : japonais (JA)