Processing

Please wait...

Settings

Settings

Goto Application

1. WO2021042529 - ARTICLE ABSTRACT AUTOMATIC GENERATION METHOD, DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM

Publication Number WO/2021/042529
Publication Date 11.03.2021
International Application No. PCT/CN2019/117289
International Filing Date 12.11.2019
IPC
G06F 40/30 2020.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
30Semantic analysis
G06F 16/34 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
CPC
G06F 16/345
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
345Summarisation for human users
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 刘媛源 LIU, YuanYuan
  • 汪伟 WANG, Wei
Agents
  • 深圳市沃德知识产权代理事务所(普通合伙) SHENZHEN WORLD INTELLECTUAL PROPERTY AGENCY (GENERAL PARTNERSHIP )
Priority Data
201910840724.X02.09.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) ARTICLE ABSTRACT AUTOMATIC GENERATION METHOD, DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ DE GÉNÉRATION AUTOMATIQUE D'UN RÉSUMÉ D'ARTICLE, DISPOSITIF, ET SUPPORT D'INFORMATIONS LISIBLE PAR ORDINATEUR
(ZH) 文章摘要自动生成方法、装置及计算机可读存储介质
Abstract
(EN)
Provided is a method for automatically generating an article abstract, comprising: receiving an original article data set and an original abstract data set and performing pre-processing comprising word-cutting and stop-word removal so as to obtain a primary article data set and a primary abstract data set (S1); performing word vectorization and word vector encoding on the primary article data set and primary abstract data set to obtain a training set and a label set (S2); inputting the training set and the label set into a pre-built abstract automatic generation model for training to obtain a training value; if the training value is less than a preset threshold, then the abstract automatic generation model exiting training (S3); receiving an article entered by a user, and after the article is pre-processed, word vectorized, and word vector encoded, inputting to the automatic abstract generation model to generate an abstract and outputting same (S4). Also provided are a device for automatically generating an article abstract and a computer-readable storage medium. The method can achieve accurate and efficient automatic generation of article abstracts.
(FR)
L'invention concerne un procédé de génération automatique d'un résumé d'article, comprenant : la réception d'un ensemble de données d'article d'origine et d'un ensemble de données de résumé d'origine et la réalisation d'un prétraitement comprenant une découpe de mots et une suppression de mots vides de façon à obtenir un ensemble de données d'article primaire et un ensemble de données de résumé primaire (S1) ; la réalisation d'une vectorisation de mots et d'un codage de vecteur de mots sur l'ensemble de données d'article primaire et l'ensemble de données de résumé primaires pour obtenir un ensemble d'apprentissage et un ensemble d'étiquettes (S2) ; l'entrée de l'ensemble d'apprentissage et de l'ensemble d'étiquettes dans un modèle de génération automatique de résumé pré-construit pour l'apprentissage afin d'obtenir une valeur d'apprentissage ; si la valeur d'apprentissage est inférieure à un seuil prédéfini, alors le modèle de génération automatique de résumé sort de l'apprentissage (S3) ; la réception d'un article saisi par un utilisateur, et après que l'article a fait l'objet d'un pré-traitement, d'une vectorisation de mot, et d'un codage de vecteur de mots, l'entrée dans le modèle de génération de résumé automatique pour générer un résumé et délivrer celui-ci en sortie (S4). L'invention concerne également un dispositif permettant de générer automatiquement un résumé d'article et un support de stockage lisible par ordinateur. Le procédé permet d'obtenir une génération automatique précise et efficace de résumés d'articles.
(ZH)
一种文章摘要自动生成方法,包括:接收原始文章数据集及原始摘要数据集并进行包括切词、去停用词的预处理得到初级文章数据集及初级摘要数据集(S1),将所述初级文章数据集及初级摘要数据集进行词向量化及词向量编码后得到训练集及标签集(S2),将所述训练集及标签集输入至预先构建的摘要自动生成模型中训练得到训练值,若所述训练值小于预设阈值时,所述摘要自动生成模型退出训练(S3),接收用户输入的文章,将所述文章进行上述预处理、词向量化及词向量编码后输入至所述摘要自动生成模型生成摘要并输出(S4)。还提出一种文章摘要自动生成装置以及一种计算机可读存储介质。该方法可以实现精准高效的文章摘要自动生成功能。
Also published as
Latest bibliographic data on file with the International Bureau