Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2021043015 - PROCÉDÉ ET APPAREIL DE RECONNAISSANCE VOCALE, AINSI QUE PROCÉDÉ ET APPAREIL D'APPRENTISSAGE DE RÉSEAU NEURONAL

Numéro de publication WO/2021/043015
Date de publication 11.03.2021
N° de la demande internationale PCT/CN2020/110742
Date du dépôt international 24.08.2020
CIB
G10L 15/16 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
16utilisant des réseaux neuronaux artificiels
G10L 15/06 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
06Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
CPC
G10L 15/063
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
063Training
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
Déposants
  • 腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN]/[CN]
Inventeurs
  • 王珺 WANG, Jun
  • 林永业 LAM, Wing Yip
  • 苏丹 SU, Dan
  • 俞栋 YU, Dong
Mandataires
  • 北京德琦知识产权代理有限公司 DEQI INTELLECTUAL PROPERTY LAW CORPORATION
Données relatives à la priorité
201910838469.505.09.2019CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) SPEECH RECOGNITION METHOD AND APPARATUS, AND NEURAL NETWORK TRAINING METHOD AND APPARATUS
(FR) PROCÉDÉ ET APPAREIL DE RECONNAISSANCE VOCALE, AINSI QUE PROCÉDÉ ET APPAREIL D'APPRENTISSAGE DE RÉSEAU NEURONAL
(ZH) 语音识别方法及装置、神经网络训练方法及装置
Abrégé
(EN)
The present application relates to the technical field of artificial intelligence, and provides a speech recognition method and apparatus, and a neural network training method and apparatus. The neural network training method is executed by an electronic device, and comprises: obtaining sample data, the sample data comprising a mixed speech spectrum and labeled phonemes thereof; extracting a target speech spectrum from the mixed speech spectrum by a first sub-network; performing adaptive conversion on the target speech spectrum by a second sub-network to obtain an intermediate transition feature; performing phoneme recognition by a third sub-network on the basis of the intermediate transition feature; and updating parameters of the first sub-network, the second sub-network, and the third sub-network according to the phoneme recognition result and the labeled phonemes.
(FR)
La présente invention se rapporte au domaine technique de l'intelligence artificielle, et concerne un procédé et un appareil de reconnaissance vocale, ainsi qu'un procédé et un appareil d'apprentissage de réseau neuronal. Le procédé d'apprentissage de réseau neuronal est exécuté par un dispositif électronique et comprend les étapes consistant à : obtenir des données d'échantillon, les données d'échantillon comprenant un spectre vocal mixte et des phonèmes étiquetés de celui-ci ; extraire un spectre vocal cible à partir du spectre vocal mixte par un premier sous-réseau ; effectuer une conversion adaptative sur le spectre vocal cible par un deuxième sous-réseau pour obtenir une caractéristique de transition intermédiaire ; effectuer une reconnaissance de phonème par un troisième sous-réseau sur la base de la caractéristique de transition intermédiaire ; et mettre à jour des paramètres du premier sous-réseau, du deuxième sous-réseau et du troisième sous-réseau en fonction du résultat de la reconnaissance de phonèmes et des phonèmes étiquetés.
(ZH)
本申请提供一种语音识别方法及装置、神经网络训练方法及装置;涉及人工智能技术领域。该神经网络训练方法由电子设备执行,包括:获取样本数据,所述样本数据包括混合语音频谱及其标注音素;通过第一子网络从混合语音频谱中提取目标语音频谱;通过第二子网络对所述目标语音频谱进行适应性转换以得到中间过渡表征;通过第三子网络,基于所述中间过渡表征进行音素识别;根据所述音素识别的结果以及所述标注音素,对所述第一子网络、第二子网络以及第三子网络的参数进行更新。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international