Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018227781) VOICE RECOGNITION METHOD, APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/227781 International Application No.: PCT/CN2017/100049
Publication Date: 20.12.2018 International Filing Date: 31.08.2017
IPC:
G10L 15/02 (2006.01) ,G10L 15/14 (2006.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
02
Feature extraction for speech recognition; Selection of recognition unit
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
08
Speech classification or search
14
using statistical models, e.g. Hidden Markov Models [HMM]
Applicants:
平安科技(深圳)有限公司 PING AN TECHNOLOGY(SHENZHEN) CO., LTD. [CN/CN]; 中国广东省深圳市 福田区八卦岭八卦三路平安大厦 Ping An Building, No.3 Bagua. Road, Bagualing, Futian District Shenzhen, Guangdong 518000, CN
Inventors:
梁浩 LIANG, Hao; CN
王健宗 WANG, Jianzong; CN
程宁 CHENG, Ning; CN
肖京 XIAO, Jing; CN
Agent:
广州华进联合专利商标代理有限公司 ADVANCE CHINA IP LAW OFFICE; 中国广东省广州市 天河区花城大道85号3901房 Room 3901, No. 85 Huacheng Avenue, Tianhe District Guangzhou, Guangdong 510623, CN
Priority Data:
201710438772.712.06.2017CN
Title (EN) VOICE RECOGNITION METHOD, APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM
(FR) PROCÉDÉ DE RECONNAISSANCE VOCALE, APPAREIL, DISPOSITIF INFORMATIQUE ET SUPPORT DE STOCKAGE
(ZH) 语音识别方法、装置、计算机设备及存储介质
Abstract:
(EN) The present application provides a method for voice recognition, said method comprising: obtaining to-be-recognized voice data; extracting a filter-bank feature and MFCC feature from voice data; taking the MFCC feature to be input data of a GMM-HMM model, and obtaining a first likelihood probability matrix; taking the filter-bank feature to be an input feature of a two-dimensional LSTM model, and obtaining a posterior probability matrix; taking the posterior probability matrix and first likelihood probability matrix to be input data of an HMM model, obtaining a second likelihood probability matrix, and according to the second likelihood probability matrix, obtaining a corresponding target word sequence from a phoneme decoding network.
(FR) La présente invention concerne un procédé de reconnaissance vocale, ledit procédé comprenant : l'obtention de données vocales à reconnaître; l'extraction d'une caractéristique de banc de filtres et d'une caractéristique MFCC à partir de données vocales; l'utilisation de la caractéristique MFCC en tant que donnée d'entrée d'un modèle GMM-HMM, et l'obtention d'une première matrice de probabilité de similitude; l'utilisation de la caractéristique de banc de filtres en tant que caractéristique d'entrée d'un modèle LSTM bidimensionnel, et l'obtention d'une matrice de probabilité postérieure; l'utilisation de la matrice de probabilité postérieure et de la première matrice de probabilité de similitude en tant que données d'entrée d'un modèle HMM, l'obtention d'une deuxième matrice de probabilité de similitude, et en fonction de la deuxième matrice de probabilité de similitude, l'obtention d'une séquence de mots cibles correspondants à partir d'un réseau de décodage de phonème.
(ZH) 本申请提出了一种语音识别方法,该方法包括:获取待识别的语音数据;提取语音数据中的Filter Bank特征和MFCC特征;将MFCC特征作为GMM-HMM模型的输入数据,获取第一似然概率矩阵;将Filter Bank特征作为二维LSTM模型的输入特征,获取后验概率矩阵;将后验概率矩阵和第一似然概率矩阵作为HMM模型的输入数据,获取第二似然概率矩阵,根据第二似然概率矩阵在音素解码网络中获取对应的目标词序列。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)