Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020140620 - INTELLIGENT DECISION BASED TEXT CLASSIFICATION METHOD AND DEVICE, SERVER AND STORAGE MEDIUM

Publication Number WO/2020/140620
Publication Date 09.07.2020
International Application No. PCT/CN2019/117861
International Filing Date 13.11.2019
IPC
G06F 16/35 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
CPC
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06K 9/62
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 金戈 JIN, Ge
  • 徐亮 XU, Liang
Agents
  • 广州三环专利商标代理有限公司 SCIHEAD IP LAW FIRM
Priority Data
201910007838.604.01.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) INTELLIGENT DECISION BASED TEXT CLASSIFICATION METHOD AND DEVICE, SERVER AND STORAGE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF DE CLASSIFICATION DE TEXTE BASÉE SUR UNE DÉCISION INTELLIGENTE, SERVEUR ET SUPPORT D'INFORMATIONS
(ZH) 基于智能决策的文本分类方法、装置、服务器及存储介质
Abstract
(EN)
An intelligent decision based text classification method and device, a server and a storage medium. The method comprises: using a training text to build a first bag of words (S101), the first bag of words comprising word features of each comment text of the training text; determining, from the word features of the first bag of words, word feature set satisfying a preset condition, and generating a second bag of words according to the word feature set (S102); building a cascaded forest model for text classification by means of the second bag of words (S103); and invoking, when a target comment text to be classified needs to be classified and identified, the cascaded forest model to classify the target comment text to obtain a classified result for the target comment text (S104). The method can improve calculation speed and classification accuracy.
(FR)
L'invention concerne un procédé et un dispositif de classification de texte basée sur une décision intelligente, un serveur et un support d'informations. Le procédé consiste : à utiliser un texte d'apprentissage afin de construire un premier sac de mots (S101), le premier sac de mots comprenant des caractéristiques de mot de chaque texte de commentaire du texte d'apprentissage ; à déterminer, à partir des caractéristiques de mot du premier sac de mots, un ensemble de caractéristiques de mot satisfaisant une condition prédéfinie, et à générer un second sac de mots selon l'ensemble de caractéristiques de mot (S102) ; à construire un modèle de forêt en cascade pour une classification de texte au moyen du second sac de mots (S103) ; et à invoquer, lorsqu'un texte de commentaire cible à classifier doit être classé et identifié, le modèle de forêt en cascade permettant de classifier le texte de commentaire cible afin d'obtenir un résultat classé pour le texte de commentaire cible (S104). Le procédé peut améliorer la vitesse de calcul et la précision de la classification.
(ZH)
一种基于智能决策的文本分类方法、装置、服务器及存储介质,其中,该方法包括:利用训练文本构建第一词袋模型(S101);所述第一词袋模型包括所述训练文本中各评语文本的词特征;从所述第一词袋模型的词特征中确定出满足预设条件的词特征集合,并根据所述词特征集合生成第二词袋模型(S102);通过所述第二词袋模型构建用于文本分类的级联森林模型(S103);在需要对待分类的目标评语文本进行分类识别时,调用所述级联森林模型对所述目标评语文本进行分类,得到对所述目标评语文本的分类结果(S104)。采用所述方法,可以提高计算速率和分类精度。
Also published as
Latest bibliographic data on file with the International Bureau