WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2011159628) SPEECH AND NOISE MODELS FOR SPEECH RECOGNITION
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2011/159628    International Application No.:    PCT/US2011/040225
Publication Date: 22.12.2011 International Filing Date: 13.06.2011
IPC:
G10L 15/20 (2006.01)
Applicants: GOOGLE INC. [US/US]; 1600 Amphitheatre Parkway Mountain View, CA 94043 (US) (For All Designated States Except US).
LLOYD, Matthew I. [GB/US]; (US) (For US Only).
KRISTJANSSON, Trausti [IS/US]; (US) (For US Only)
Inventors: LLOYD, Matthew I.; (US).
KRISTJANSSON, Trausti; (US)
Agent: JEPSEN, Nicholas; Fish & Richardson P.C. P.O. Box 1022 Minneapolis, MN 55440-1022 (US)
Priority Data:
12/814,665 14.06.2010 US
Title (EN) SPEECH AND NOISE MODELS FOR SPEECH RECOGNITION
(FR) MODÈLES DE BRUIT ET DE VOIX POUR LA RECONNAISSANCE VOCALE
Abstract: front page image
(EN)An audio signal generated by a device based on audio input from a user may be received. The audio signal may include at least a user audio portion that corresponds to one or more user utterances recorded by the device. A user speech model associated with the user may be accessed and a determination may be made background audio in the audio signal is below a defined threshold. In response to determining that the background audio in the audio signal is below the defined threshold, the accessed user speech model may be adapted based on the audio signal to generate an adapted user speech model that models speech characteristics of the user. Noise compensation may be performed on the received audio signal using the adapted user speech model to generate a filtered audio signal with reduced background audio compared to the received audio signal.
(FR)Un signal audio généré par un dispositif sur la base d'une entrée audio d'un utilisateur peut être reçu. Le signal audio peut comprendre au moins une partie audio utilisateur qui correspond à un ou plusieurs énoncés de l'utilisateur enregistrés par le dispositif. Il est possible d'accéder à un modèle de voix utilisateur associé à l'utilisateur et de déterminer si un bruit de fond dans le signal audio est en dessous d'un seuil défini. En réponse à la détermination du fait que le bruit de fond dans le signal est en dessous d'un seuil défini, le modèle de voix utilisateur accessible peut être adapté en fonction du signal audio afin de générer un modèle de voix utilisateur adapté qui modélise les caractéristiques vocales de l'utilisateur. Une compensation de bruit peut être effectuée sur le signal audio reçu au moyen du modèle de voix utilisateur adapté afin de générer un signal audio filtré avec un bruit de fond réduit en comparaison au signal audio reçu.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)