Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020220824 - VOICE RECOGNITION METHOD AND DEVICE

Publication Number WO/2020/220824
Publication Date 05.11.2020
International Application No. PCT/CN2020/077590
International Filing Date 03.03.2020
IPC
G10L 15/06 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Applicants
  • 京东数字科技控股有限公司 JINGDONG DIGITS TECHNOLOGY HOLDING CO., LTD. [CN]/[CN]
Inventors
  • 付立 FU, Li
  • 李萧萧 LI, Xiaoxiao
Agents
  • 中原信达知识产权代理有限责任公司 CHINA SINDA INTELLECTUAL PROPERTY LIMITED
Priority Data
201910354527.729.04.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) VOICE RECOGNITION METHOD AND DEVICE
(FR) PROCÉDÉ ET DISPOSITIF DE RECONNAISSANCE VOCALE
(ZH) 识别语音的方法和装置
Abstract
(EN)
A voice recognition method and device. The method comprises: respectively setting initial values of a Chinese character coefficient and a Pinyin coefficient, generating a Chinese character mapping function according to the initial value of the Chinese character coefficient, and generating a Pinyin mapping function according to the initial value of the Pinyin coefficient (S101); training the Chinese character mapping function and the Pinyin mapping function using a plurality of preset training samples, calculating the training results as parameters of a joint loss function, and generating a target mapping function according to the calculation results (S102); and recognizing, according to the target mapping function, voice to be recognized, so as to obtain the Chinese character recognition result and the Pinyin recognition result of said voice (S103). The method reduces voice recognition costs while ensuring the accuracy of voice recognition.
(FR)
La présente invention concerne un procédé et un dispositif de reconnaissance vocale. Le procédé comprend les étapes consistant à : définir respectivement des valeurs initiales d'un coefficient de caractère chinois et d'un coefficient Pinyin, générer une fonction de mappage de caractères chinois selon la valeur initiale du coefficient de caractère chinois, et générer une fonction de mappage Pinyin en fonction de la valeur initiale du coefficient Pinyin (S101) ; entraîner la fonction de mappage de caractères chinois et la fonction de mappage Pinyin en utilisant une pluralité d'échantillons d'apprentissage prédéfinis, calculer les résultats d'apprentissage comme paramètres d'une fonction de perte commune, et générer une fonction de mappage cible selon les résultats de calcul (S102) ; et reconnaître, selon la fonction de mappage cible, une voix à reconnaître, de façon à obtenir le résultat de reconnaissance de caractère chinois et le résultat de reconnaissance Pinyin de ladite voix (S103). Le procédé réduit les coûts de reconnaissance vocale tout en garantissant la précision de la reconnaissance vocale.
(ZH)
一种识别语音的方法,该方法包括:分别设置汉字系数和拼音系数的初始值,根据汉字系数的初始值生成汉字映射函数,根据拼音系数的初始值生成拼音映射函数(S101);用预设的多个训练样本训练汉字映射函数和拼音映射函数,将训练结果作为联合损失函数的参数进行计算,根据计算结果生成目标映射函数(S102);根据目标映射函数对待识别语音进行识别,得到待识别语音的汉字识别结果和拼音识别结果(S103)。该方法在保证语音识别准确性的同时降低语音识别成本。
Latest bibliographic data on file with the International Bureau