WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017199416) ACOUSTIC MODEL LEARNING DEVICE, ACOUSTIC MODEL LEARNING METHOD, SPEECH RECOGNITION DEVICE, AND SPEECH RECOGNITION METHOD
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/199416    International Application No.:    PCT/JP2016/064981
Publication Date: 23.11.2017 International Filing Date: 20.05.2016
IPC:
G10L 15/07 (2013.01)
Applicants: MITSUBISHI ELECTRIC CORPORATION [JP/JP]; 7-3, Marunouchi 2-chome, Chiyoda-ku, Tokyo 1008310 (JP)
Inventors: HANAZAWA, Toshiyuki; (JP)
Agent: INABA, Tadahiko; (JP)
Priority Data:
Title (EN) ACOUSTIC MODEL LEARNING DEVICE, ACOUSTIC MODEL LEARNING METHOD, SPEECH RECOGNITION DEVICE, AND SPEECH RECOGNITION METHOD
(FR) DISPOSITIF D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE, PROCÉDÉ D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE, DISPOSITIF DE RECONNAISSANCE VOCALE ET PROCÉDÉ DE RECONNAISSANCE VOCALE
(JA) 音響モデル学習装置、音響モデル学習方法、音声認識装置、および音声認識方法
Abstract: front page image
(EN)This acoustic model learning device is capable of learning an acoustic model that ensures accurate recognition even for first utterances, without delay in recognition completion time, as a result of learning the acoustic model by using: learning data for each speaker, having the average vector of all feature vectors for each speaker subtracted from each feature vector for each speaker; and learning data for all speakers, having the average vector for all feature vectors for all speakers subtracted from each feature vector for all speakers. In addition, this speech recognition device is capable of ensuring accuracy of speech recognition without delay in recognition completion time, even for first utterances, as a result of comparing a corrected vector to the acoustic model by using the average vector for all feature vectors for all speakers as a correction vector, if the input audio is a first utterance, said corrected vector being the correction vector subtracted from a feature vector for the input audio.
(FR)L'invention concerne un dispositif d'apprentissage de modèle acoustique permettant d'apprendre un modèle acoustique qui garantit une reconnaissance précise même pour des premiers énoncés, sans retard dans le temps d'exécution de reconnaissance, suite à l'apprentissage du modèle acoustique utilisant : des données d'apprentissage pour chaque locuteur, le vecteur moyen de tous les vecteurs caractéristiques pour chaque locuteur étant soustrait de chaque vecteur caractéristique pour chaque locuteur ; et des données d'apprentissage pour tous les locuteurs, le vecteur moyen pour tous les vecteurs caractéristiques pour tous les locuteurs étant soustrait de chaque vecteur caractéristique pour tous les locuteurs. De plus, ce dispositif de reconnaissance vocale est capable de garantir la précision de la reconnaissance vocale sans retard dans le temps d’exécution de reconnaissance, même pour des premiers énoncés, suite à la comparaison d'un vecteur corrigé avec le modèle acoustique en utilisant le vecteur moyen pour tous les vecteurs caractéristiques de tous les locuteurs comme vecteur de correction si le signal audio d'entrée est un premier énoncé, ledit vecteur corrigé étant le vecteur de correction soustrait d'un vecteur caractéristique pour le signal audio d'entrée.
(JA)この発明の音響モデル学習装置は、話者毎の各特徴ベクトルから話者毎の全ての特徴ベクトルの平均ベクトルを減算して作成した話者毎の学習データと、全話者の各特徴ベクトルから全話者の全ての特徴ベクトルの平均ベクトルを減算して作成した全話者の学習データとを用いて音響モデルを学習するので、第1発話目に対しても認識終了時間の遅延なしに認識精度を確保した音響モデルを学習することができる。また、この発明の音声認識装置は、入力された音声が第1発話目であれば、全話者の全ての特徴ベクトルの平均ベクトルを補正ベクトルとして、入力された音声の特徴ベクトルから補正ベクトルを減算した補正後ベクトルを前記音響モデルと照合するので、第1発話目に対しても認識終了時間の遅延なしに音声認識の精度を確保することができる。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)