Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018077244) ACOUSTIC-GRAPHEMIC MODEL AND ACOUSTIC-GRAPHEMIC-PHONEMIC MODEL FOR COMPUTER-AIDED PRONUNCIATION TRAINING AND SPEECH PROCESSING
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/077244 International Application No.: PCT/CN2017/108098
Publication Date: 03.05.2018 International Filing Date: 27.10.2017
IPC:
G10L 15/00 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
Applicants:
THE CHINESE UNIVERSITY OF HONG KONG [CN/CN]; Office of Research and Knowledge Transfer Services Room 301, Pi Ch'iu Building Shatin, New Territories Hong Kong 999077, CN
Inventors:
MENG, Helen, Mei-Ling; CN
LI, Kun; CN
SUN, Lifa; CN
WU, Xixin; CN
Agent:
INSIGHT INTELLECTUAL PROPERTY LIMITED; 19 A, Tower A, InDo Building No. 48A Zhichun Road, Haidian District Beijing 100098, CN
Priority Data:
62/413,93927.10.2016US
Title (EN) ACOUSTIC-GRAPHEMIC MODEL AND ACOUSTIC-GRAPHEMIC-PHONEMIC MODEL FOR COMPUTER-AIDED PRONUNCIATION TRAINING AND SPEECH PROCESSING
(FR) MODÈLE ACOUSTIQUE-GRAPHÉMIQUE ET MODÈLE ACOUSTIQUE-GRAPHÉMIQUE-PHONÉMIQUE POUR APPRENTISSAGE DE PRONONCIATION ASSISTÉ PAR ORDINATEUR ET TRAITEMENT VOCAL
Abstract:
(EN) An Acoustic-Graphemic Model (AGM) and an Acoustic-Graphemic-Phonemic Model (AGPM) for analyzing speech at the phone level are introduced. An AGM is a multi-distribution deep neural network (MD-DNN) for which the inputs include a representation of acoustical features of an utterance and a corresponding graphemic transcription of the text. Inputs for an AGPM may include acoustical features, a graphemic transcription, and a canonical phonemic transition. Outputs from either an AGM or AGPM may include posterior probabilities for each phone in a set of recognizable phones. From the posterior probabilities, a most probable sequence of phones can be determined, e.g., using a Viterbi decoding algorithm and a state transition model that provides the posterior probability of a particular phone given a particular sequence of preceding phones.
(FR) L'invention concerne un modèle acoustique-graphémique (AGM) et un modèle acoustique-graphémique-phonémique (AGPM) permettant d'analyser la parole au niveau du téléphone. Un AGM est un réseau neuronal profond à distribution multiple (MD-DNN) pour lequel les entrées comprennent une représentation des caractéristiques acoustiques d'un énoncé ainsi qu'une transcription graphémique correspondante du texte. Les entrées d'un AGPM peuvent comprendre des caractéristiques acoustiques, une transcription graphémique et une transition phonémique canonique. Les sorties d'un AGM ou d'un AGPM peuvent comprendre des probabilités postérieures pour chaque téléphone dans un ensemble de téléphones reconnaissables. À partir des probabilités postérieures, il est possible de déterminer une séquence la plus probable de téléphones, par exemple, à l'aide d'un algorithme de décodage de Viterbi et d'un modèle de transition d'état qui fournit la probabilité postérieure d'un téléphone particulier en tenant compte d'une séquence particulière de téléphones précédents.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)