Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2018077244) MODÈLE ACOUSTIQUE-GRAPHÉMIQUE ET MODÈLE ACOUSTIQUE-GRAPHÉMIQUE-PHONÉMIQUE POUR APPRENTISSAGE DE PRONONCIATION ASSISTÉ PAR ORDINATEUR ET TRAITEMENT VOCAL
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/077244 N° de la demande internationale : PCT/CN2017/108098
Date de publication : 03.05.2018 Date de dépôt international : 27.10.2017
CIB :
G10L 15/00 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
Déposants :
THE CHINESE UNIVERSITY OF HONG KONG [CN/CN]; Office of Research and Knowledge Transfer Services Room 301, Pi Ch'iu Building Shatin, New Territories Hong Kong 999077, CN
Inventeurs :
MENG, Helen, Mei-Ling; CN
LI, Kun; CN
SUN, Lifa; CN
WU, Xixin; CN
Mandataire :
INSIGHT INTELLECTUAL PROPERTY LIMITED; 19 A, Tower A, InDo Building No. 48A Zhichun Road, Haidian District Beijing 100098, CN
Données relatives à la priorité :
62/413,93927.10.2016US
Titre (EN) ACOUSTIC-GRAPHEMIC MODEL AND ACOUSTIC-GRAPHEMIC-PHONEMIC MODEL FOR COMPUTER-AIDED PRONUNCIATION TRAINING AND SPEECH PROCESSING
(FR) MODÈLE ACOUSTIQUE-GRAPHÉMIQUE ET MODÈLE ACOUSTIQUE-GRAPHÉMIQUE-PHONÉMIQUE POUR APPRENTISSAGE DE PRONONCIATION ASSISTÉ PAR ORDINATEUR ET TRAITEMENT VOCAL
Abrégé :
(EN) An Acoustic-Graphemic Model (AGM) and an Acoustic-Graphemic-Phonemic Model (AGPM) for analyzing speech at the phone level are introduced. An AGM is a multi-distribution deep neural network (MD-DNN) for which the inputs include a representation of acoustical features of an utterance and a corresponding graphemic transcription of the text. Inputs for an AGPM may include acoustical features, a graphemic transcription, and a canonical phonemic transition. Outputs from either an AGM or AGPM may include posterior probabilities for each phone in a set of recognizable phones. From the posterior probabilities, a most probable sequence of phones can be determined, e.g., using a Viterbi decoding algorithm and a state transition model that provides the posterior probability of a particular phone given a particular sequence of preceding phones.
(FR) L'invention concerne un modèle acoustique-graphémique (AGM) et un modèle acoustique-graphémique-phonémique (AGPM) permettant d'analyser la parole au niveau du téléphone. Un AGM est un réseau neuronal profond à distribution multiple (MD-DNN) pour lequel les entrées comprennent une représentation des caractéristiques acoustiques d'un énoncé ainsi qu'une transcription graphémique correspondante du texte. Les entrées d'un AGPM peuvent comprendre des caractéristiques acoustiques, une transcription graphémique et une transition phonémique canonique. Les sorties d'un AGM ou d'un AGPM peuvent comprendre des probabilités postérieures pour chaque téléphone dans un ensemble de téléphones reconnaissables. À partir des probabilités postérieures, il est possible de déterminer une séquence la plus probable de téléphones, par exemple, à l'aide d'un algorithme de décodage de Viterbi et d'un modèle de transition d'état qui fournit la probabilité postérieure d'un téléphone particulier en tenant compte d'une séquence particulière de téléphones précédents.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)