Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020134154 - ARTIFICIAL INTELLIGENCE-BASED TEXT DATA ENHANCEMENT METHOD AND DEVICE, EQUIPMENT AND STORAGE MEDIUM

Publication Number WO/2020/134154
Publication Date 02.07.2020
International Application No. PCT/CN2019/103684
International Filing Date 30.08.2019
IPC
G06F 17/27 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
27Automatic analysis, e.g. parsing, orthograph correction
CPC
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 金戈 JIN, Ge
  • 徐亮 XU, Liang
  • 肖京 XIAO, Jing
Agents
  • 深圳市世联合知识产权代理有限公司 SL INTELLECTUAL PROPERTY CO., LTD.
Priority Data
201811641967.229.12.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) ARTIFICIAL INTELLIGENCE-BASED TEXT DATA ENHANCEMENT METHOD AND DEVICE, EQUIPMENT AND STORAGE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF D'AMÉLIORATION DE DONNÉES DE TEXTE REPOSANT SUR L'INTELLIGENCE ARTIFICIELLE ET DISPOSITIF, ÉQUIPEMENT ET SUPPORT D'INFORMATIONS
(ZH) 基于人工智能的文本数据增强方法、装置、设备及存储介质
Abstract
(EN)
The present application relates to the technical field of artificial intelligence, and relates to an artificial intelligence-based text data enhancement method and device, equipment and a storage medium. The method comprises: providing a first input text in a text database to a text generation model, and the text generation model converting the first input text into at least one first output text; calculating the word order fluency of the first output text; comparing the word order fluency of the first output text to the word order fluency of a correct text; and when the word order fluency of the first output text is greater than or equal to the word order fluency of the correct text, providing the first output text as a second input text to the text generation model, so that the text generation model converts the second input text into at least one second output text, the word order fluency of the second output text being less than that of the correct text. Thus, the data size of text generation model training is increased.
(FR)
La présente invention se rapporte au domaine technique de l'intelligence artificielle et concerne un procédé d'amélioration de données de texte reposant sur l'intelligence artificielle et un dispositif, un équipement et un support d'informations. Le procédé consiste : à fournir un premier texte d'entrée dans une base de données de texte à un modèle de génération de texte, et le modèle de génération de texte convertit le premier texte d'entrée en au moins un premier texte de sortie ; à calculer la fluidité d'ordre de mots du premier texte de sortie ; à comparer la fluidité d'ordre de mots du premier texte de sortie à la fluidité d'ordre de mots d'un texte correct ; et lorsque la fluidité d'ordre de mots du premier texte de sortie est supérieure ou égale à la fluidité d'ordre de mots du texte correct, à fournir le premier texte de sortie en tant que second texte d'entrée au modèle de génération de texte, de sorte que le modèle de génération de texte convertisse le second texte d'entrée en au moins un second texte de sortie, la fluidité d'ordre de mots du second texte de sortie étant inférieure à celle du texte correct. Ainsi, la taille de données de l'apprentissage du modèle de génération de texte est augmentée.
(ZH)
本申请属于人工智能技术领域,涉及基于人工智能的文本数据增强方法、装置、设备及存储介质。该方法包括:将文本数据库中的第一输入文本提供给文本生成模型,并由所述文本生成模型将所述第一输入文本转化成至少一条第一输出文本;计算所述第一输出文本的语序流畅度;将所述第一输出文本的语序流畅度与正确文本的语序流畅度比较;当所述第一输出文本的语序流畅度大于或者等于所述正确文本的语序流畅度时,将所述第一输出文本作为第二输入文本提供给所述文本生成模型,以使得所述文本生成模型将所述第二输入文本转化成至少一条第二输出文本,所述第二输出文本的语序流畅度小于所述正确文本的语序流畅度。其增加了文本生成模型训练的数据量。
Also published as
Latest bibliographic data on file with the International Bureau