WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018022220) FORMATION DE MODÈLE ACOUSTIQUE À L'AIDE DE TERMES CORRIGÉS
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2018/022220    N° de la demande internationale :    PCT/US2017/038336
Date de publication : 01.02.2018 Date de dépôt international : 20.06.2017
CIB :
G10L 15/06 (2013.01), G10L 15/22 (2006.01), G10L 15/32 (2013.01)
Déposants : GOOGLE LLC [US/US]; 1600 Amphitheatre Parkway Mountain View, California 94043 (US)
Inventeurs : KAPRALOVA, Olga; (US).
CHEREPANOV, Evgeny A.; (CH).
OSMAKOV, Dmitry; (CH).
BAEUML, Martin; (CH).
SKOBELTSYN, Gleb; (CH)
Mandataire : JORDAN, David E.A.; (US)
Données relatives à la priorité :
15/224,104 29.07.2016 US
Titre (EN) ACOUSTIC MODEL TRAINING USING CORRECTED TERMS
(FR) FORMATION DE MODÈLE ACOUSTIQUE À L'AIDE DE TERMES CORRIGÉS
Abrégé : front page image
(EN)Methods, systems, and apparatus, including computer programs encoded on computer storage media, for speech recognition. One of the methods includes receiving first audio data corresponding to an utterance; obtaining a first transcription of the first audio data; receiving data indicating (i) a selection of one or more terms of the first transcription and (ii) one or more of replacement terms; determining that one or more of the replacement terms are classified as a correction of one or more of the selected terms; in response to determining that the one or more of the replacement terms are classified as a correction of the one or more of the selected terms, obtaining a first portion of the first audio data that corresponds to one or more terms of the first transcription; and using the first portion of the first audio data that is associated with the one or more terms of the first transcription to train an acoustic model for recognizing the one or more of the replacement terms. In example implementations, an improved speech recognition system is provided which can produce improved transcription of a term or term from various pronunciations of the term or terms.
(FR)L'invention concerne des procédés, des systèmes et un appareil, comprenant des programmes informatiques codés sur des supports de stockage informatiques, pour une reconnaissance vocale. L'un des procédés comprend la réception de premières données audio correspondant à un énoncé ; l'obtention d'une première transcription des premières données audio ; la réception de données indiquant (i) une sélection d'un ou de plusieurs termes de la première transcription et (ii) un ou plusieurs des termes de remplacement ; la détermination qu'un ou plusieurs des termes de remplacement sont classés en tant que correction d'un ou de plusieurs des termes sélectionnés ; en réponse à la détermination du fait que l'un ou plusieurs des termes de remplacement sont classés en tant que correction d'un ou de plusieurs des termes sélectionnés, l'obtention d'une première partie des premières données audio qui correspond à un ou à plusieurs termes de la première transcription ; l'utilisation de la première partie des premières données audio qui est associée à un ou à plusieurs termes de la première transcription pour former un modèle acoustique qui reconnaisse un ou plusieurs des termes de remplacement. Dans des modes de réalisation donnés à titre d'exemple, l'invention concerne un système de reconnaissance vocale amélioré capable de produire une transcription améliorée d'un terme ou de termes à partir de différentes prononciations du ou des termes.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)