WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014096506) PROCÉDÉ, APPAREIL, ET PRODUIT LOGICIEL POUR PERSONNALISER LA RECONNAISSANCE VOCALE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/096506    N° de la demande internationale :    PCT/FI2012/051285
Date de publication : 26.06.2014 Date de dépôt international : 21.12.2012
CIB :
G10L 15/065 (2013.01), G10L 15/30 (2013.01)
Déposants : NOKIA TECHNOLOGIES OY [FI/FI]; Karaportti 3 FI-02610 Espoo (FI)
Inventeurs : PAK, Yongbeom; (FI)
Mandataire : NOKIA TECHNOLOGIES OY; IPR Department Jussi Jaatinen Karakaari 7 FI-02610 Espoo (FI)
Données relatives à la priorité :
Titre (EN) METHOD, APPARATUS, AND COMPUTER PROGRAM PRODUCT FOR PERSONALIZING SPEECH RECOGNITION
(FR) PROCÉDÉ, APPAREIL, ET PRODUIT LOGICIEL POUR PERSONNALISER LA RECONNAISSANCE VOCALE
Abrégé : front page image
(EN)A method, apparatus and computer program product are provided for personalizing speech recognition data. A speech recognition model (SRM) that is adaptable by a user terminal based on user terminal dependent data may be received and adapted by a user terminal. A speaker dependent SRM may be refined on the user terminal and transmitted to a remote storage location, such as personalized speech recognition apparatus. The apparatus may cause transmission of SRMs to various user terminals, and may generate additional SRMs based on speaker dependent SRMs. Speaker dependent SRMs may be generated based on an individual, group of users, geographic location, dialect, or the like. SRMs may be based on hidden Markov Models,dynamic time warming models, neural networks, finite state transducers, or the like.
(FR)L'invention concerne un procédé, un appareil et un produit logiciel pour personnaliser les données de reconnaissance vocale. Un modèle de reconnaissance vocale (SRM) qui est adaptable par un terminal utilisateur sur base de données dépendant du terminal utilisateur peut être reçu et adapté par un terminal utilisateur. Un modèle de reconnaissance vocale dépendant du locuteur peut être affiné sur le terminal utilisateur et transmis à un emplacement de stockage distant, tel qu'un appareil de reconnaissance vocale personnalisé. L'appareil peut provoquer la transmission de modèles de reconnaissance vocale vers divers terminaux utilisateur, et peut générer des modèles de reconnaissance vocale supplémentaires sur base des modèles de reconnaissance vocale dépendant du locuteur. Des modèles de reconnaissance vocale dépendant du locuteur peuvent être générés sur base d'un sujet, d'un groupe d'utilisateurs, d'un emplacement géographique, d'un dialecte, ou similaires. Les modèles de reconnaissance vocale peuvent être basés sur des modèles de Markov cachés, des modèles dynamiques à réchauffement temporel, des réseaux neuraux, des transducteurs à état fini, ou similaires.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)