WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2017213055) DISPOSITIF DE RECONNAISSANCE DE LA PAROLE ET PROGRAMME INFORMATIQUE
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2017/213055    N° de la demande internationale :    PCT/JP2017/020689
Date de publication : 14.12.2017 Date de dépôt international : 02.06.2017
CIB :
G10L 15/16 (2006.01), G10L 15/193 (2013.01)
Déposants : NATIONAL INSTITUTE OF INFORMATION AND COMMUNICATIONS TECHNOLOGY [JP/JP]; 4-2-1 Nukui-Kitamachi, Koganei-shi, Tokyo 1848795 (JP)
Inventeurs : KANDA, Naoyuki; (JP)
Mandataire : SHIMIZU, Satoshi; (JP)
Données relatives à la priorité :
2016-115515 09.06.2016 JP
Titre (EN) SPEECH RECOGNITION DEVICE AND COMPUTER PROGRAM
(FR) DISPOSITIF DE RECONNAISSANCE DE LA PAROLE ET PROGRAMME INFORMATIQUE
(JA) 音声認識装置及びコンピュータプログラム
Abrégé : front page image
(EN)[Problem] To provide a speech recognition device that achieves improved speech recognition accuracy by taking advantage of the characteristic of a neural network. [Solution] A speech recognition device 280 comprises: an acoustic model 308 for, when an observation sequence configured from a speech feature quantity obtained from input speech 282 by a feature quantity extraction unit 304 has been given, calculating the probability that the observation sequence is some symbol sequence, the acoustic model being based on an End-to-End neural network; and a decoder 310 for decoding a speech signal by a WFST 320 based on the posterior probability of a word sequence for a symbol sequence candidate when the symbol sequence candidate has been given, a probability calculated by the acoustic model 308 for each of a plurality of symbol sequences selected on the basis of the observation sequence, and a posterior probability calculated for each of the plurality of symbol sequences.
(FR)[Problème] Fournir un dispositif de reconnaissance de la parole qui améliore la précision de reconnaissance de la parole par mise à profit de la caractéristique d'un réseau neuronal. [Solution] Dispositif de reconnaissance de la parole 280 comprenant : un modèle acoustique 308 destiné à, lorsqu'une séquence d'observation, configurée à partir d'une quantité de caractéristiques de parole obtenue à partir de la parole d'entrée 282 par une unité d'extraction de quantité de caractéristiques 304, a été donnée, calculer la probabilité que la séquence d'observation est une certaine séquence de symboles, le modèle acoustique étant basé sur un réseau neuronal de bout en bout ; ainsi qu'un décodeur 310 destiné à décoder un signal vocal à l'aide d'un transducteur d'états finis pondérés (WFST) 320, sur la base de la probabilité à posteriori d'une séquence de mots pour une séquence de symboles candidate lorsque la séquence de symboles candidate a été donnée, d'une probabilité calculée par le modèle acoustique 308 pour chaque séquence d'une pluralité de séquences de symboles sélectionnées sur la base de la séquence d'observation, et d'une probabilité a posteriori calculée pour chaque séquence de la pluralité de séquences de symboles.
(JA)【課題】ニューラルネットワークの特性を活かして、音声認識精度を高めることができる音声認識装置を提供する。 【解決手段】音声認識装置280は、入力音声282から特徴量抽出部304により得られた音声特徴量からなる観測系列が与えられたときに、当該観測系列があるシンボル系列である確率を算出するための、End-to-End型ニューラルネットワークに基づく音響モデル308と、シンボル系列候補が与えられたときに、当該シンボル系列候補に対する単語列の事後確率、観測系列に基づいて選択される複数のシンボル系列について、音響モデル308により算出される確率、及び、複数のシンボル系列の各々に対して算出される事後確率に基づいたWFST320により音声信号をデコードするデコーダ310とを含む。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : japonais (JA)
Langue de dépôt : japonais (JA)