WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017199417) SPEECH RECOGNITION DEVICE AND SPEECH RECOGNITION METHOD
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/199417 International Application No.: PCT/JP2016/064982
Publication Date: 23.11.2017 International Filing Date: 20.05.2016
IPC:
G10L 15/20 (2006.01) ,G10L 15/065 (2013.01)
Applicants: MITSUBISHI ELECTRIC CORPORATION[JP/JP]; 7-3, Marunouchi 2-chome, Chiyoda-ku, Tokyo 1008310, JP
Inventors: HANAZAWA, Toshiyuki; JP
Agent: INABA, Tadahiko; JP
Priority Data:
Title (EN) SPEECH RECOGNITION DEVICE AND SPEECH RECOGNITION METHOD
(FR) SYSTÈME DE RECONNAISSANCE VOCALE ET PROCÉDÉ DE RECONNAISSANCE VOCALE
(JA) 音声認識装置および音声認識方法
Abstract: front page image
(EN) This speech recognition device: corrects the difference between the average vector for an acoustic model and the average vector for input audio, to a feature vector for the input audio; and verifies the corrected feature vector against an acoustic model having a distribution value adjusted in accordance with whether or not the input audio is a first utterance. As a result, the accuracy of speech recognition for first utterances can be ensured, without delay in recognition completion time, even if there is peripheral noise or differences between microphone frequency characteristics when the acoustic model was learned and when the input audio is recognized.
(FR) Ce dispositif de reconnaissance vocale corrige la différence entre le vecteur moyen pour un modèle acoustique et le vecteur moyen pour l'audio d'entrée, en un vecteur de caractéristiques pour l'audio d'entrée ; et vérifie le vecteur de caractéristique corrigé par rapport à un modèle acoustique possédant une valeur de distribution ajustée selon que l'audio d'entrée se trouve ou non dans un premier énoncé. Il en résulte que la précision de la reconnaissance de la parole pour les premiers énoncés peut être assurée, sans retard dans le temps d'achèvement de la reconnaissance, même s'il y a un bruit périphérique ou des différences entre les caractéristiques de fréquence du microphone lorsque le modèle acoustique a été appris et lorsque le signal audio d'entrée est reconnu.
(JA) この発明の音声認識装置は、音響モデルの平均ベクトルと入力された音声の平均ベクトルとの差分を入力された音声の特徴ベクトルに補正し、補正した特徴ベクトルを入力された音声が第1発話目であるか否かに応じて分散値を調整した音響モデルで照合する。そのため、音響モデルの学習時と入力された音声の認識時とでマイクの周波数特性の違いや周囲に騒音があっても、第1発話目に対して認識終了時間の遅延なしに音声認識の精度を確保することができる
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)