Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020107840 - SENTENCE DISTANCE MAPPING METHOD AND APPARATUS BASED ON MACHINE LEARNING, AND COMPUTER DEVICE

Publication Number WO/2020/107840
Publication Date 04.06.2020
International Application No. PCT/CN2019/089059
International Filing Date 29.05.2019
IPC
G06F 17/27 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
27Automatic analysis, e.g. parsing, orthograph correction
CPC
G06K 9/62
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 刘宇超 LIU, Yuchao
  • 郭典 GUO, Dian
  • 韩铃 HAN, Ling
Agents
  • 深圳市明日今典知识产权代理事务所(普通合伙) SHENZHEN MINGRIJINDIAN INTELLECTUAL PROPERTY AGENCY FIRM (GENERAL)
Priority Data
201811437243.628.11.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SENTENCE DISTANCE MAPPING METHOD AND APPARATUS BASED ON MACHINE LEARNING, AND COMPUTER DEVICE
(FR) PROCÉDÉ ET APPAREIL DE MAPPAGE DE DISTANCES ENTRE PHRASES, BASÉS SUR L'APPRENTISSAGE AUTOMATIQUE ET DISPOSITIF INFORMATIQUE
(ZH) 基于机器学习的句子距离映射方法、装置和计算机设备
Abstract
(EN)
Disclosed in the present application are a sentence distance mapping method and apparatus based on machine learning, a computer device, and a storage medium, the method comprising: acquiring inputted single sentence speech information; converting the single sentence speech information into single sentence text information; pre-processing the single sentence text information and querying a preset word vector library to acquire word vectors corresponding to the single words in the pre-processed single sentence text information; on the basis of the word vectors corresponding to the single words in the single sentence text information, using a preset algorithm to calculate the distance between the single sentence text information and a preset standard single sentence; and inputting the distance into a preset function and mapping out a score, the preset function being obtained by means of training with training data. The degree of similarity between sentences is thereby calculated, having the technical effect of being more accurate and intuitive.
(FR)
La présente invention concerne un procédé et un appareil de mappage de distances entre phrases, basés sur l'apprentissage automatique, un dispositif informatique et un support de stockage, le procédé comprenant : l'acquisition d'informations orales par phrases uniques entrées ; la conversion des informations orales par phrases uniques en informations écrites par phrases uniques ; le prétraitement des informations écrites par phrases uniques et l'interrogation d'une bibliothèque prédéfinie de vecteurs de mots pour acquérir des vecteurs de mots correspondant aux mots uniques parmi les informations écrites par phrases uniques prétraitées ; en fonction des vecteurs de mots correspondant aux mots uniques parmi les informations écrites par phrases uniques, l'utilisation d'un algorithme prédéfini permettant de calculer la distance entre les informations écrites par phrases uniques et une phrase unique standard prédéfinie ; et l'entrée de la distance dans une fonction prédéfinie et le mappage d'un score, la fonction prédéfinie s'obtenant par apprentissage utilisant des données d'apprentissage. On calcule ainsi le degré de similarité entre des phrases, ce qui a l'effet technique d'une précision et d'un caractère intuitif améliorés.
(ZH)
本申请揭示了一种基于机器学习的句子距离映射方法、装置、计算机设备和存储介质,所述方法包括:获取输入的单句语音信息;将所述单句语音信息转换为单句文字信息;对所述单句文字信息进行预处理,并查询预设的词向量库以获取所述预处理后的单句文字信息中各个单词对应的词向量;根据所述单句文字信息中各个单词对应的词向量,使用预设算法计算出所述单句文字信息与预设的标准单句的距离;将所述距离输入预设函数,映射出评分,其中所述预设函数通过训练数据训练得出。从而精确计算出句子间的相似度,具有更准确、更直观的技术效果。
Also published as
Latest bibliographic data on file with the International Bureau