Processing

Please wait...

Settings

Settings

Goto Application

1. WO2021027218 - TEXT CLASSIFICATION METHOD AND APPARATUS, AND COMPUTER READABLE MEDIUM

Publication Number WO/2021/027218
Publication Date 18.02.2021
International Application No. PCT/CN2019/126947
International Filing Date 20.12.2019
IPC
G06F 16/35 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
Applicants
  • 北京国双科技有限公司 BEIJING GRIDSUM TECHNOLOGY CO., LTD. [CN]/[CN]
Inventors
  • 彭程 PENG, Cheng
Agents
  • 北京集佳知识产权代理有限公司 UNITALEN ATTORNEYS AT LAW
Priority Data
201910741430.112.08.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) TEXT CLASSIFICATION METHOD AND APPARATUS, AND COMPUTER READABLE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE CLASSIFICATION DE TEXTE ET SUPPORT LISIBLE PAR ORDINATEUR
(ZH) 文本分类的方法、装置以及计算机可读介质
Abstract
(EN)
A text classification method and apparatus, and a computer readable medium: acquiring an inputted text (S101); on the basis of the inputted text, calculating a feature matrix of the text (S102); on the basis of the feature matrix of the text, calculating a first associated feature matrix of the text (S103), the first associated feature matrix comprising a first associated feature vector of each sentence in the text, and the first associated feature vector being used for illustrating the association between each sentence and the other sentences in the text; on the basis of the first associated feature vector of the text, calculating a classification prediction matrix of the text (S104), the classification prediction matrix of the text comprising a classification prediction vector of each sentence in the text, and the classification prediction vector being used for illustrating the weighting value of each sentence belonging to each preset tag. When calculating the classification prediction matrix of the text, the present method takes into account the association between each sentence and the other sentences in the text, and therefore increases the accuracy of text predictive classification.
(FR)
La présente invention concerne un procédé et un appareil de classification de texte et un support lisible par ordinateur, le procédé comprenant les étapes consistant à : acquérir un texte entré (S101) ; sur la base du texte entré, calculer une matrice de caractéristiques du texte (S102) ; sur la base de la matrice de caractéristiques du texte, calculer une première matrice de caractéristiques associée du texte (S103), la première matrice de caractéristiques associée comprenant un premier vecteur de caractéristiques associé de chaque phrase dans le texte, et le premier vecteur de caractéristiques associé étant utilisé pour illustrer l'association entre chaque phrase et les autres phrases dans le texte ; sur la base du premier vecteur de caractéristiques associé du texte, calculer une matrice de prédiction de classification du texte (S104), la matrice de prédiction de classification du texte comprenant un vecteur de prédiction de classification de chaque phrase dans le texte, et le vecteur de prédiction de classification étant utilisé pour illustrer la valeur de pondération de chaque phrase appartenant à chaque étiquette prédéfinie. Lors du calcul de la matrice de prédiction de classification du texte, le présent procédé prend en compte l'association entre chaque phrase et les autres phrases dans le texte, et augmente donc la précision de la classification prédictive de texte.
(ZH)
一种文本分类的方法、装置以及计算机可读介质,通过获取输入的文本(S101);根据输入的文本,计算得到文本的特征矩阵(S102);根据文本的特征矩阵,计算得到文本的第一关联特征矩阵(S103);文本的第一关联特征矩阵包括文本中每一个句子的第一关联特征向量;第一关联特征向量用于说明每一个句子与文本中的其他句子间的关联性;根据文本的第一关联特征矩阵,计算得到文本的分类预测矩阵(S104);其中,文本的分类预测矩阵包括文本中每一个句子的分类预测向量;分类预测向量用于说明每一个句子属于每一个预设标签的权重值。该方法在计算文本的分类预测矩阵时,考虑到文本中的每一个句子与文本中其他句子的关联性,因此提高了文本预测分类的准确度。
Latest bibliographic data on file with the International Bureau