WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014004612) RECONNAISSANCE VOCALE À MODÈLE MIXTE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/004612    N° de la demande internationale :    PCT/US2013/047780
Date de publication : 03.01.2014 Date de dépôt international : 26.06.2013
CIB :
G10L 15/18 (2013.01), G10L 15/32 (2013.01), G10L 15/22 (2006.01), G10L 15/30 (2013.01), G10L 15/193 (2013.01), G10L 15/197 (2013.01)
Déposants : GOOGLE INC. [US/US]; 1600 Amphitheatre Parkway Mountain View, CA 94043 (US)
Inventeurs : GRUENSTEIN, Alexander, H.; (US).
ALEKSIC, Petar; (US)
Mandataire : HOOVER, Kenneth, J.; Fish & Richardson P.C. P.O. Box 1022 Minneapolis, MN 55440-1022 (US)
Données relatives à la priorité :
61/664,324 26.06.2012 US
13/838,379 15.03.2013 US
Titre (EN) MIXED MODEL SPEECH RECOGNITION
(FR) RECONNAISSANCE VOCALE À MODÈLE MIXTE
Abrégé : front page image
(EN)In one aspect, a method comprises accessing audio data generated by a computing device based on audio input from a user, the audio data encoding one or more user utterances. The method further comprises generating a first transcription of the utterances by performing speech recognition on the audio data using a first speech recognizer that employs a language model based on user-specific data. The method further comprises generating a second transcription of the utterances by performing speech recognition on the audio data using a second speech recognizer that employs a language model independent of user-specific data. The method further comprises determining that the second transcription of the utterances includes a term from a predefined set of one or more terms. The method further comprises, based on determining that the second transcription of the utterance includes the term, providing an output of the first transcription of the utterance.
(FR)L'invention concerne, dans un aspect, un procédé comportant une étape consistant à accéder à des données audio générées par un dispositif informatique sur la base d'une entrée audio provenant d'un utilisateur, les données audio codant un ou plusieurs énoncés de l'utilisateur. Le procédé comporte en outre une étape consistant à générer une première transcription des énoncés en effectuant une reconnaissance vocale sur les données audio à l'aide d'un premier moteur de reconnaissance vocale qui emploie un modèle de langue basé sur des données spécifiques à l'utilisateur. Le procédé comporte en outre une étape consistant à générer une deuxième transcription des énoncés en effectuant une reconnaissance vocale sur les données audio à l'aide d'un deuxième moteur de reconnaissance vocale qui emploie un modèle de langue indépendant de données spécifiques à l'utilisateur. Le procédé comporte en outre une étape consistant à déterminer que la deuxième transcription des énoncés comprend un terme issu d'un ensemble prédéfini d'un ou de plusieurs termes. Le procédé comporte en outre une étape consistant, sur la base d'une détermination selon laquelle une deuxième transcription de l'énoncé comprend le terme en question, à effectuer une sortie de la première transcription de l'énoncé.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)