WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017166966) METHOD AND APPARATUS FOR CONSTRUCTING SPEECH DECODING NETWORK IN DIGITAL SPEECH RECOGNITION, AND STORAGE MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/166966    International Application No.:    PCT/CN2017/074926
Publication Date: 05.10.2017 International Filing Date: 27.02.2017
IPC:
G10L 15/02 (2006.01), G10L 15/14 (2006.01)
Applicants: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; 35/F,Tencent Building, Kejizhongyi Road, Midwest District of Hi-tech park Nanshan District Shenzhen, Guangdong 518057 (CN)
Inventors: WU, Fuzhang; (CN).
QIAN, Binghua; (CN).
LI, Wei; (CN).
LI, Ke; (CN).
WU, Yongjian; (CN).
HUANG, Feiyue; (CN)
Agent: DEQI INTELLECTUAL PROPERTY LAW CORPORATION; 7/F, Xueyuan International Tower Haidian District, NO.1 Zhichun Road Beijing 100083 (CN)
Priority Data:
201610188168.9 29.03.2016 CN
Title (EN) METHOD AND APPARATUS FOR CONSTRUCTING SPEECH DECODING NETWORK IN DIGITAL SPEECH RECOGNITION, AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE CONSTRUCTION DE RÉSEAU DE DÉCODAGE VOCAL DANS LE CADRE DE LA RECONNAISSANCE VOCALE NUMÉRIQUE, ET SUPPORT D'ENREGISTREMENT
(ZH) 数字语音识别中语音解码网络的构建方法、装置及存储介质
Abstract: front page image
(EN)A method for constructing a speech decoding network in digital speech recognition. The method comprises: acquiring training data obtained by means of digital speech recording, wherein the training data comprises a plurality of speech segments, with each speech segment containing pieces of speech of a plurality of digits (110); performing acoustic feature extraction on the training data to obtain a feature sequence corresponding to each speech segment (130); according to the feature sequence and a phone corresponding to a digit in the training data, performing, starting with a mono-phone acoustic model, progressive training to obtain an acoustic model (150); and acquiring a language model, and constructing, by means of the language model and the acoustic model obtained through training, a speech decoding network (170).
(FR)L'invention concerne un procédé de construction d'un réseau de décodage vocal dans le cadre de la reconnaissance vocale numérique. Le procédé comprend les étapes suivantes : acquérir des données d'apprentissage obtenues au moyen d'un enregistrement vocal numérique, les données d'apprentissage comprenant une pluralité de segments vocaux, chaque segment vocal contenant des éléments vocaux d'une pluralité de chiffres (110) ; effectuer une extraction de caractéristiques acoustiques sur les données d'apprentissage pour obtenir une séquence de caractéristiques correspondant à chaque segment vocal (130) ; selon la séquence de caractéristiques et un phone correspondant à un chiffre dans les données d'apprentissage, effectuer, à partir d'un modèle acoustique monophone, un apprentissage progressif pour obtenir un modèle acoustique (150) ; et acquérir un modèle de langage, et construire, au moyen du modèle de langage et du modèle acoustique obtenu par apprentissage, un réseau de décodage vocal (170).
(ZH)一种数字语音识别中语音解码网络的构建方法,该方法包括:获取通过数字语音录制所得到的训练数据,其中,训练数据包括若干语音段,每个语音段包含多个数字的语音(110);进行训练数据中的声学特征提取,得到每一语音段对应的特征序列(130);根据特征序列和训练数据中数字对应的音素,进行以单音素声学模型为起始的渐进训练得到声学模型(150);获取语言模型,通过语言模型和训练得到的声学模型构建语音解码网络(170)。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)