Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020113031 - APPRENTISSAGE ET/OU UTILISATION D’UN MODÈLE DE SÉLECTION DE LANGUE POUR DÉTERMINER AUTOMATIQUEMENT UNE LANGUE POUR LA RECONNAISSANCE DE PAROLE D’UN ÉNONCÉ PARLÉ

Numéro de publication WO/2020/113031
Date de publication 04.06.2020
N° de la demande internationale PCT/US2019/063643
Date du dépôt international 27.11.2019
CIB
G10L 15/00 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
G06N 3/00 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
CPC
G06N 20/10
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
10using kernel methods, e.g. support vector machines [SVM]
G06N 3/0445
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0445Feedback networks, e.g. hopfield nets, associative networks
G06N 3/084
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
084Back-propagation
G06N 3/088
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
088Non-supervised learning, e.g. competitive learning
G10L 15/005
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
005Language recognition
Déposants
  • GOOGLE LLC [US]/[US]
Inventeurs
  • WAN, Li
  • YU, Yang
  • SRIDHAR, Prashant
  • MORENO, Ignacio Lopez
  • WANG, Quan
Mandataires
  • HIGDON, Scott
  • MIDDLETON REUTLINGER
  • SALAZAR, John
  • SHUMAKER, Brantley
  • PURCELL, John
Données relatives à la priorité
62/772,51428.11.2018US
62/772,92229.11.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) TRAINING AND/OR USING A LANGUAGE SELECTION MODEL FOR AUTOMATICALLY DETERMINING LANGUAGE FOR SPEECH RECOGNITION OF SPOKEN UTTERANCE
(FR) APPRENTISSAGE ET/OU UTILISATION D’UN MODÈLE DE SÉLECTION DE LANGUE POUR DÉTERMINER AUTOMATIQUEMENT UNE LANGUE POUR LA RECONNAISSANCE DE PAROLE D’UN ÉNONCÉ PARLÉ
Abrégé
(EN)
Methods and systems for training and/or using a language selection model for use in determining a particular language of a spoken utterance captured in audio data. Features of the audio data can be processed using the trained language selection model to generate a predicted probability for each of N different languages, and a particular language selected based on the generated probabilities. Speech recognition results for the particular language can be utilized responsive to selecting the particular language of the spoken utterance. Many implementations are directed to training the language selection model utilizing tuple losses in lieu of traditional cross-entropy losses. Training the language selection model utilizing the tuple losses can result in more efficient training and/or can result in a more accurate and/or robust model – thereby mitigating erroneous language selections for spoken utterances.
(FR)
La présente invention concerne des procédés et des systèmes d’apprentissage et/ou d’utilisation d’un modèle de sélection de langue pour une utilisation dans la détermination d’une langue particulière d’un énoncé parlé capturé dans des données audio. Des caractéristiques des données audio peuvent être traitées au moyen du modèle de sélection de langue entraîné pour générer une probabilité prédite pour chacune de N langues différentes, et une langue particulière sélectionnée sur la base des probabilités générées. Des résultats de reconnaissance de la parole pour la langue particulière peuvent être utilisés en réponse à la sélection de la langue particulière de l’énoncé parlé. De nombreux modes de réalisation concernent l’apprentissage du modèle de sélection de langue au moyen de pertes de tuple au lieu de pertes d’entropie croisée conventionnelles. L’apprentissage du modèle de sélection de langue au moyen des pertes de tuple peut conduire à un apprentissage plus efficace et/ou peut conduire à un modèle plus précis et/ou robuste, de façon à réduire les sélections de langue erronées pour des énoncés prononcés.
Également publié en tant que
EP2019828380
Dernières données bibliographiques dont dispose le Bureau international