Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020107878 - METHOD AND APPARATUS FOR GENERATING TEXT SUMMARY, COMPUTER DEVICE AND STORAGE MEDIUM

Publication Number WO/2020/107878
Publication Date 04.06.2020
International Application No. PCT/CN2019/092616
International Filing Date 25.06.2019
IPC
G06F 16/34 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
CPC
G06F 40/289
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 金戈 JIN, Ge
  • 徐亮 XU, Liang
  • 肖京 XIAO, Jing
Agents
  • 深圳市精英专利事务所 SHENZHEN TALENT PATENT SERVICE
Priority Data
201811455100.830.11.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) METHOD AND APPARATUS FOR GENERATING TEXT SUMMARY, COMPUTER DEVICE AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL POUR PRODUIRE UN RÉSUMÉ DE TEXTE, DISPOSITIF INFORMATIQUE ET SUPPORT DE STOCKAGE
(ZH) 文本摘要生成方法、装置、计算机设备及存储介质
Abstract
(EN)
A method and apparatus for generating a text summary, a computer device and a storage medium, which are applied to the field of neural networks in prediction models. The method comprises: pre-processing a target text and converting the pre-processed target text by means of a word vector tool so as to obtain a word vector (S110); constructing a text summarization model that uses encoding and decoding as a frame, using the word vector as an input of the text summarization model and training the text summarization model in a loop iteration manner to output sentences to be extracted (S120); pre-processing a text to be processed and converting same into a word vector, and inputting the word vector of the text to be processed into the trained text summarization model to output a plurality of sentences to be extracted (S130); scoring the plurality of sentences to be extracted according to a preset scoring function model, and generating a text summary according to the scores of the sentences to be extracted (S140).
(FR)
L'invention concerne un procédé et un appareil pour produire un résumé de texte, un dispositif informatique et un support de stockage, qui sont appliqués au domaine des réseaux neuronaux dans des modèles de prévision. Le procédé consiste à : prétraiter un texte cible et convertir le texte cible prétraité au moyen d'un outil de vecteur de mot de façon à obtenir un vecteur de mot (S110) ; construire un modèle de production de résumé de texte qui utilise le codage et le décodage en tant que trame, utiliser le vecteur de mot en tant qu'entrée du modèle de production de résumé de texte et entraîner le modèle de production de résumé de texte dans un mode d'itération en boucle pour délivrer des phrases à extraire (S120) ; prétraiter un texte à traiter et le convertir en un vecteur de mot, et entrer le vecteur de mot du texte à traiter dans le modèle de production de résumé de texte entraîné pour délivrer en sortie une pluralité de phrases à extraire (S130) ; noter la pluralité de phrases à extraire selon un modèle de fonction de notation prédéfini, et générer un résumé de texte en fonction des scores des phrases à extraire (S140).
(ZH)
一种文本摘要生成方法、装置、计算机设备及存储介质,应用于预测模型中的神经网络领域。该方法包括:对目标文本进行预处理并通过词向量工具对预处理后的目标文本进行转换以得到词向量(S110);构建以编码解码为框架的文本摘要模型,将词向量作为文本摘要模型的输入并以循环迭代的方式对文本摘要模型进行训练输出待抽取的句子(S120);对待处理文本进行预处理并转换为词向量,将待处理文本的词向量输入到训练后的文本摘要模型中输出多个待抽取的句子(S130);根据预设评分函数模型对多个待抽取的句子进行评分,并根据待抽取的句子的评分生成文本摘要(S140)。
Also published as
Latest bibliographic data on file with the International Bureau