Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persists, please contact us atFeedback&Contact
1. (WO2017099936) SYSTEM AND METHODS FOR ADAPTING NEURAL NETWORK ACOUSTIC MODELS
Latest bibliographic data on file with the International Bureau

Pub. No.: WO/2017/099936 International Application No.: PCT/US2016/061326
Publication Date: 15.06.2017 International Filing Date: 10.11.2016
IPC:
G10L 15/16 (2006.01) ,G10L 15/07 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
08
Speech classification or search
16
using artificial neural networks
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
06
Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
065
Adaptation
07
to the speaker
Applicants:
NUANCE COMMUNICATIONS, INC. [US/US]; One Wayside Road Burlington, MA 01803, US
Inventors:
ZHAN, Puming; US
LI, Xinwei; US
Agent:
RUDOY, Daniel G.; US
Priority Data:
14/965,63710.12.2015US
Title (EN) SYSTEM AND METHODS FOR ADAPTING NEURAL NETWORK ACOUSTIC MODELS
(FR) SYSTÈME ET PROCÉDÉS D'ADAPTATION DE MODÈLES ACOUSTIQUES DE RÉSEAU NEURONAL
Abstract:
(EN) Techniques for adapting a trained neural network acoustic model, comprising using at least one computer hardware processor to perform: generating initial speaker information values for a speaker; generating first speech content values from first speech data corresponding to a first utterance spoken by the speaker; processing the first speech content values and the initial speaker information values using the trained neural network acoustic model; recognizing, using automatic speech recognition, the first utterance based, at least in part on results of the processing; generating updated speaker information values using the first speech data and at least one of the initial speaker information values and/or information used to generate the initial speaker information values; and recognizing, based at least in part on the updated speaker information values, a second utterance spoken by the speaker.
(FR) La présente invention concerne des techniques d'adaptation d'un modèle acoustique de réseau neuronal entraîné, comprenant l'utilisation d'au moins un processeur de matériel informatique pour réaliser : la génération de valeurs d'informations de locuteur initiales pour un locuteur ; la génération de premières valeurs de contenu vocal à partir de premières données vocales correspondant à un premier énoncé prononcé par le locuteur ; le traitement des premières valeurs de contenu vocal et des valeurs d'information de locuteur initiales à l'aide du modèle acoustique de réseau neuronal entraîné ; la reconnaissance, à l'aide d'une reconnaissance vocale automatique, du premier énoncé sur la base, au moins en partie, des résultats du traitement ; la génération de valeurs d'informations de locuteur mises à jour à l'aide des premières données vocales et des valeurs d'information de locuteur initiales et/ou des informations utilisées pour générer les valeurs d'informations de locuteur initiales ; et la reconnaissance d'un second énoncé prononcé par le locuteur sur la base, au moins en partie, des valeurs d'informations de locuteur mises à jour.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)