Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2017172658) RECONNAISSANCE VOCALE ET SYSTÈME D'APPRENTISSAGE TEXTE-PAROLE
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2017/172658 N° de la demande internationale : PCT/US2017/024388
Date de publication : 05.10.2017 Date de dépôt international : 28.03.2017
CIB :
G10L 13/08 (2013.01) ,G10L 15/07 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
13
Synthèse de la parole; Systèmes de synthèse de la parole à partir de texte
08
Analyse de texte ou génération de paramètres pour la synthèse de la parole à partir de texte, p.ex. conversion graphème-phonème, génération de prosodie ou détermination de l'intonation ou de l'accent tonique
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
06
Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
065
Adaptation
07
au locuteur
Déposants :
MICROSOFT TECHNOLOGY LICENSING, LLC [US/US]; Attn: Patent Group Docketing (Bldg. 8/1000) One Microsoft Way Redmond, Washington 98052-6399, US
Inventeurs :
ZHAO, Pei; US
YAO, Kaisheng; US
LEUNG, Max; US
YAN, Bo; US
Mandataire :
MINHAS, Sandip; US
CHEN, Wei-Chen Nicholas; US
DRAKOS, Katherine J.; US
KADOURA, Judy M.; US
HOLMES, Danielle J.; US
SWAIN, Cassandra T.; US
WONG, Thomas S.; US
CHOI, Daniel; US
Données relatives à la priorité :
15/087,69631.03.2016US
Titre (EN) SPEECH RECOGNITION AND TEXT-TO-SPEECH LEARNING SYSTEM
(FR) RECONNAISSANCE VOCALE ET SYSTÈME D'APPRENTISSAGE TEXTE-PAROLE
Abrégé :
(EN) An example text-to-speech learning system performs a method for generating a pronunciation sequence conversion model. The method includes generating a first pronunciation sequence from a speech input of a training pair and generating a second pronunciation sequence from a text input of the training pair. The method also includes determining a pronunciation sequence difference between the first pronunciation sequence and the second pronunciation sequence; and generating a pronunciation sequence conversion model based on the pronunciation sequence difference. An example speech recognition learning system performs a method for generating a pronunciation sequence conversion model. The method includes extracting an audio signal vector from a speech input and applying an audio signal conversion model to the audio signal vector to generate a converted audio signal vector. The method also includes adapting an acoustic model based on the converted audio signal vector to generate an adapted acoustic model.
(FR) Un système d'apprentissage texte-parole donné à titre d'exemple exécute un procédé permettant de générer un modèle de conversion de séquence de prononciation. Le procédé consiste à générer une première séquence de prononciation à partir d'une entrée vocale d'une paire d'apprentissage ainsi qu'à générer une seconde séquence de prononciation à partir d'une entrée de texte de la paire d'apprentissage. Le procédé consiste également à : déterminer une différence de séquence de prononciation entre la première séquence de prononciation et la seconde séquence de prononciation ; et générer un modèle de conversion de séquence de prononciation d'après la différence de séquence de prononciation. Un système d'apprentissage de reconnaissance vocale donné à titre d'exemple exécute un procédé permettant de générer un modèle de conversion de séquence de prononciation. Le procédé consiste à extraire un vecteur de signal audio d'une entrée vocale ainsi qu'à appliquer un modèle de conversion de signal audio au vecteur de signal audio afin de générer un vecteur de signal audio converti. Le procédé consiste également à adapter un modèle acoustique d'après le vecteur de signal audio converti afin de générer un modèle acoustique adapté.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)