Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 27.07.2021 at 12:00 PM CEST
Settings

Settings

Goto Application

1. WO2020140632 - HIDDEN FEATURE EXTRACTION METHOD, APPARATUS, COMPUTER DEVICE AND STORAGE MEDIUM

Publication Number WO/2020/140632
Publication Date 09.07.2020
International Application No. PCT/CN2019/118242
International Filing Date 14.11.2019
IPC
G06F 17/00 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
CPC
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 17/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 金戈 JIN, Ge
  • 徐亮 XU, Liang
Agents
  • 深圳市精英专利事务所 SHENZHEN TALENT PATENT SERVICE
Priority Data
201910007711.404.01.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) HIDDEN FEATURE EXTRACTION METHOD, APPARATUS, COMPUTER DEVICE AND STORAGE MEDIUM
(FR) PROCÉDÉ D'EXTRACTION DE CARACTÉRISTIQUES MASQUÉES, APPAREIL, DISPOSITIF INFORMATIQUE ET SUPPORT DE STOCKAGE
(ZH) 隐含特征提取方法、装置、计算机设备及存储介质
Abstract
(EN)
Provided by the embodiments of the present application are a hidden feature extraction method, an apparatus, a computer device, and a computer-readable storage medium. The embodiments of the present application relate to the technical field of text classification. In the embodiments of the present application, when hidden feature extraction is performed, a first corpus for performing hidden feature extraction is acquired, word embedding is performed on the first corpus so as to convert the first corpus into a word vector, a word vector feature of the word vector is extracted by means of a convolutional neural network, the word vector is clustered and described by using an unsupervised algorithm, and then the word vector feature is encoded by means of self-encoding so as to extract a hidden feature of the word vector feature.
(FR)
Les modes de réalisation de l'invention concernent un procédé d'extraction de caractéristiques masquées, un appareil, un dispositif informatique et un support de stockage lisible par ordinateur. Les modes de réalisation de la présente invention relèvent du domaine technique de la classification de texte. Dans les modes de réalisation de l’invention, lorsqu'une extraction de caractéristiques masquées est effectuée, un premier corpus permettant d’effectuer une extraction de caractéristiques masquées est acquis, une intégration de mots est effectuée sur le premier corpus de façon à convertir le premier corpus un vecteur de mots, une caractéristique du vecteur de mots est extraite au moyen d'un réseau neuronal convolutionnel, le vecteur de mots est groupé puis décrit à l'aide d'un algorithme non supervisé, et la caractéristique du vecteur de mots est codée au moyen d'un auto-codage de façon à extraire une caractéristique masquée de la caractéristique du vecteur de mots.
(ZH)
本申请实施例提供了一种隐含特征提取方法、装置、计算机设备及计算机可读存储介质。本申请实施例属于文本分类技术领域,本申请实施例在实现隐含特征提取时,通过获取进行隐含特征提取的第一语料,将所述第一语料进行词嵌入以将所述第一语料转化为词向量,通过卷积神经网络提取所述词向量的词向量特征,从而采用无监督算法将所述词向量进行聚类描述,然后将所述词向量特征通过自编码方式进行编码以提取所述词向量特征的隐含特征。
Also published as
Latest bibliographic data on file with the International Bureau