Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020114108 - CLUSTERING RESULT INTERPRETATION METHOD AND DEVICE

Publication Number WO/2020/114108
Publication Date 11.06.2020
International Application No. PCT/CN2019/112090
International Filing Date 21.10.2019
IPC
G06K 9/62 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
G06F 16/35 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
CPC
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06K 9/622
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6218Clustering techniques
622Non-hierarchical partitioning techniques
G06K 9/6256
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6256Obtaining sets of training patterns; Bootstrap methods, e.g. bagging, boosting
G06K 9/6268
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6267Classification techniques
6268relating to the classification paradigm, e.g. parametric or non-parametric approaches
Applicants
  • 阿里巴巴集团控股有限公司 ALIBABA GROUP HOLDING LIMITED
Inventors
  • 王力 WANG, Li
  • 向彪 XIANG, Biao
  • 周俊 ZHOU, Jun
Agents
  • 北京博思佳知识产权代理有限公司 BEIJING BESTIPR INTELLECTUAL PROPERTY LAW CORPORATION
Priority Data
201811471749.904.12.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) CLUSTERING RESULT INTERPRETATION METHOD AND DEVICE
(FR) PROCÉDÉ ET DISPOSITIF D'INTERPRÉTATION DE RÉSULTATS DE REGROUPEMENT
(ZH) 聚类结果的解释方法和装置
Abstract
(EN)
A clustering result interpretation method and device. The method comprises: embedding embedded objects by using an embedding algorithm to obtain an embedding result of each embedded object (S102); clustering the embedding results by using a clustering model to obtain a category label of each embedded object (S104); training an interpretation model by using the characteristics and category labels of the embedded objects (S106); extracting multiple embedded objects from each category (S108); determining interpretation characteristics of the embedded objects belonging to the described category according to the characteristic of each extracted embedded object and the trained interpretation model (S110); and summarizing an interpretation characteristic of each extracted embedded object in the same category to obtain interpretation characteristics of the clustering model in the described category (S112).
(FR)
L'invention concerne un procédé et un dispositif d'interprétation de résultats de regroupement. Le procédé consiste : à incorporer des objets incorporés à l'aide d'un algorithme d'incorporation pour obtenir un résultat d'incorporation de chaque objet incorporé (S102) ; à regrouper les résultats d'incorporation à l'aide d'un modèle de regroupement pour obtenir une étiquette de catégorie de chaque objet incorporé (S104) ; à entraîner un modèle d'interprétation à l'aide des caractéristiques et des étiquettes de catégorie des objets incorporés (S106) ; à extraire de multiples objets incorporés de chaque catégorie (S108) ; à déterminer des caractéristiques d'interprétation des objets incorporés appartenant à la catégorie décrite en fonction de la caractéristique de chaque objet incorporé extrait et du modèle d'interprétation entraîné (S110) ; et à résumer une caractéristique d'interprétation de chaque objet incorporé extrait dans la même catégorie pour obtenir des caractéristiques d'interprétation du modèle de regroupement dans la catégorie décrite (S112).
(ZH)
一种聚类结果的解释方法和装置。该方法包括:采用嵌入算法对嵌入对象进行嵌入处理,得到每个嵌入对象的嵌入结果(S102);采用聚类模型对所述嵌入结果进行聚类,得到每个嵌入对象的类别标签(S104);采用所述嵌入对象的特征和类别标签对解释模型进行训练(S106);针对每个类别,从所述类别中提取若干嵌入对象(S108);基于提取的每个嵌入对象的特征和已训练的解释模型确定所述嵌入对象属于所述类别的解释特征(S110);汇总同一类别下提取的每个嵌入对象的解释特征,得到所述聚类模型在该类别下的解释特征(S112)。
Also published as
Latest bibliographic data on file with the International Bureau