Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020140633 - TEXT TOPIC EXTRACTION METHOD, APPARATUS, ELECTRONIC DEVICE, AND STORAGE MEDIUM

Publication Number WO/2020/140633
Publication Date 09.07.2020
International Application No. PCT/CN2019/118287
International Filing Date 14.11.2019
IPC
G06F 16/34 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
G06N 3/04 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
CPC
G06F 16/34
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
G06F 17/16
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
16Matrix or vector computation ; , e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 金戈 JIN, Ge
  • 徐亮 XU, Liang
  • 肖京 XIAO, Jing
Agents
  • 北京鸿元知识产权代理有限公司 GRANDER IP LAW FIRM
Priority Data
201910008265.904.01.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) TEXT TOPIC EXTRACTION METHOD, APPARATUS, ELECTRONIC DEVICE, AND STORAGE MEDIUM
(FR) PROCÉDÉ D'EXTRACTION DE SUJET DE TEXTE, APPAREIL, DISPOSITIF ÉLECTRONIQUE ET SUPPORT DE STOCKAGE
(ZH) 文本主题提取方法、装置、电子设备及存储介质
Abstract
(EN)
A text topic extraction method, relating to the technical field of artificial intelligence, and comprising: constructing a text topic extraction model (S1); training the text topic extraction model (S2); obtaining a text word vector corresponding to a text sample (S3); inputting the text word vector into the trained text topic extraction model (S4); and outputting a text topic corresponding to the text sample (S5). The text topic extraction model comprises a convolutional neural network and an attention mechanism; the attention mechanism comprises a position attention mechanism and a channel attention mechanism; the position attention mechanism and the channel attention mechanism are established in parallel, are both connected to an activation layer of the convolutional neural network, and respectively apply a position attention weight and a channel attention weight; an output result of the position attention mechanism and an output result of the channel attention mechanism are both input into a fully connected layer of the convolutional neural network. Also disclosed are an apparatus, an electronic device, and a storage medium. According to the method, the operation efficiency of the text topic extraction model is improved, and the precision of text topic extraction is improved.
(FR)
L'invention concerne un procédé d'extraction de sujet de texte, se rapportant au domaine technique de l'intelligence artificielle et consistant : à construire un modèle d'extraction de sujet de texte (S1) ; à instruire le modèle d'extraction de sujet de texte (S2) ; à obtenir un vecteur de mot de texte correspondant à un échantillon de texte (S3) ; à entrer le vecteur de mot de texte dans le modèle d'extraction instruit de sujet de texte (S4) ; et à transmettre un sujet de texte correspondant à l'échantillon de texte (S5). Le modèle d'extraction de sujet de texte comprend un réseau neuronal convolutionnel et un mécanisme d'attention ; le mécanisme d'attention comprend un mécanisme d'attention de position et un mécanisme d'attention de canal ; le mécanisme d'attention de position et le mécanisme d'attention de canal sont établis en parallèle, sont tous deux connectés à une couche d'activation du réseau neuronal convolutionnel et appliquent respectivement un poids d'attention de position et un poids d'attention de canal ; un résultat de sortie du mécanisme d'attention de position et un résultat de sortie du mécanisme d'attention de canal sont tous deux introduits dans une couche complètement connectée du réseau neuronal convolutionnel. L'invention concerne également un appareil, un dispositif électronique et un support de stockage. Selon le procédé, l'efficacité de fonctionnement du modèle d'extraction de sujet de texte et la précision d'extraction de sujet de texte sont améliorées.
(ZH)
一种文本主题提取方法,属于人工智能技术领域,包括:构建文本主题提取模型(S1);训练文本主题提取模型(S2);获取文本样本对应的文本词向量(S3);将文本词向量输入经过训练的文本主题提取模型(S4);输出与所述文本样本相应的文本主题(S5),其中,文本主题提取模型包括卷积神经网络和注意力机制,注意力机制包括位置注意力机制和通道注意力机制,位置注意力机制和通道注意力机制并行建立,均与卷积神经网络的激活层连接,分别施加位置注意力权重和通道注意力权重,将位置注意力机制的输出结果和通道注意力机制的输出结果均输入卷积神经网路的全连接层。还公开了一种装置、电子设备和存储介质。该方法提高了文本主题提取模型运算效率,提高了文本主题提取的精度。
Also published as
Latest bibliographic data on file with the International Bureau