Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 27.07.2021 at 12:00 PM CEST
Settings

Settings

Goto Application

1. WO2020140487 - SPEECH RECOGNITION METHOD FOR HUMAN-MACHINE INTERACTION OF SMART APPARATUS, AND SYSTEM

Publication Number WO/2020/140487
Publication Date 09.07.2020
International Application No. PCT/CN2019/106778
International Filing Date 19.09.2019
IPC
G10L 15/22 2006.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialog
CPC
G10L 15/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
G10L 15/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
G10L 15/26
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
26Speech to text systems
G10L 17/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
22Interactive procedures; Man-machine interfaces
Applicants
  • 苏宁云计算有限公司 SUNING CLOUD COMPUTING CO., LIMITED [CN]/[CN]
  • 苏宁易购集团股份有限公司 SUNING.COM CO., LTD. [CN]/[CN]
Inventors
  • 孙鹏飞 SUN, Pengfei
  • 贾洪园 JIA, Hongyuan
  • 李春生 LI, Chunsheng
Agents
  • 北京律和信知识产权代理事务所(普通合伙) BEIJING LAWSING IP FIRM
Priority Data
201910002748.802.01.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SPEECH RECOGNITION METHOD FOR HUMAN-MACHINE INTERACTION OF SMART APPARATUS, AND SYSTEM
(FR) PROCÉDÉ DE RECONNAISSANCE VOCALE POUR L'INTERACTION HOMME-MACHINE D'UN APPAREIL INTELLIGENT ET SYSTÈME
(ZH) 用于智能设备的人机交互语音识别方法及系统
Abstract
(EN)
A speech recognition method for human-machine interaction of a smart apparatus and a system, pertaining to the technical field of speech recognition, and improving the accuracy of speech recognition by means of joint optimization training of intent detection and slot filling. The method comprises: performing word segmentation on speech data of a user's question to obtain an original word sequence, and generating a vector representation of the original word sequence by means of embedding processing; performing weighting processing on a hidden state vector hi and a slot context vector ci S to obtain a slot label model yi S; performing weighting processing on a hidden state vector hT and an intent context vector cI to obtain an intent prediction model yI; joining the slot context vector ci S and the intent context vector cI by means of a slot gate g, and obtaining a transformed representation of the slot label model yi S by means of the slot gate g; and constructing an objective function for joint optimization of the intent prediction model yI and the transformed slot label model yi S, and performing intent detection on the speech data of the user's question on the basis of the objective function.
(FR)
L'invention concerne un procédé de reconnaissance vocale pour l'interaction homme-machine d'un appareil intelligent et un système, appartenant au domaine technique de la reconnaissance vocale et améliorant la précision de la reconnaissance vocale au moyen de l'apprentissage d'optimisation conjointe de détection d'intention et de remplissage de cases. Le procédé consiste : à effectuer une segmentation de mots sur des données de parole d'une question d'un utilisateur pour obtenir une séquence de mots d'origine et à générer une représentation vectorielle de la séquence de mots d'origine au moyen d'un traitement d'incorporation ; à effectuer un traitement de pondération sur un vecteur d'état caché hi et sur un vecteur de contexte de case ci S pour obtenir un modèle d'étiquette de case yi S ; à effectuer un traitement de pondération sur un vecteur d'état caché hT et sur un vecteur de contexte d'intention cI pour obtenir un modèle de prédiction d'intention yI ; à joindre le vecteur de contexte de case ci S et le vecteur de contexte d'intention cI au moyen d'une porte de case g et à obtenir une représentation transformée du modèle d'étiquette de case yi S au moyen de la porte de case g ; et à construire une fonction objective pour une optimisation conjointe du modèle de prédiction d'intention yI et du modèle d'étiquette de case transformée yi S et à effectuer une détection d'intention sur les données de parole de la question de l'utilisateur sur la base de la fonction objective.
(ZH)
一种用于智能设备的人机交互语音识别方法及系统,属于语音识别技术领域,通过将意图识别和槽位填充进行联合优化训练,以提高语音识别的准确率。该方法包括:将用户的语音问题分词处理得到原始词序列,并通过嵌入处理对原始词序列进行向量化表示;通过将隐含状态向量h i和槽位上下文向量c i S加权处理后得到槽位标签模型y i S;通过将隐含状态向量hT和意图上下文向量c I加权处理后得到意图预测模型y I;使用槽位门g对槽位上下文向量c i S和意图上下文向量c I进行拼接处理,并通过槽位门g对槽位标签模型y i S进行转换表示;对意图预测模型y I和转换后的槽位标签模型y i S联合优化构建目标函数,并基于目标函数对用户的语音问题进行意图识别。
Also published as
Latest bibliographic data on file with the International Bureau