Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2016049975 - SYSTÈME ET PROCÉDÉ DE REGROUPEMENT ADAPTATIF À BASE DE COEFFICIENT DE REGROUPEMENT

Numéro de publication WO/2016/049975
Date de publication 07.04.2016
N° de la demande internationale PCT/CN2014/092450
Date du dépôt international 28.11.2014
CIB
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/2462
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
2462Approximate or statistical queries
G06F 16/285
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
28Databases characterised by their database models, e.g. relational or object models
284Relational databases
285Clustering or classification
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 16/9535
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
9535Search customisation based on user profiles and personalisation
G06F 2216/03
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
2216Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
03Data mining
G06K 9/6218
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6217Design or setup of recognition systems and techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
6218Clustering techniques
Déposants
  • 同济大学 TONGJI UNIVERSITY [CN]/[CN]
Inventeurs
  • 蒋昌俊 JIANG, Changjun
  • 陈闳中 CHEN, Hongzhong
  • 闫春钢 YAN, Chungang
  • 丁志军 DING, Zhijun
  • 钟明洁 ZHONG, Mingjie
  • 孙海春 SUN, Haichun
Mandataires
  • 上海光华专利事务所 J.Z.M.C.PATENT AND TRADEMARK LAW OFFICE
Données relatives à la priorité
201410512802029.09.2014CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) CLUSTERING COEFFICIENT-BASED ADAPTIVE CLUSTERING METHOD AND SYSTEM
(FR) SYSTÈME ET PROCÉDÉ DE REGROUPEMENT ADAPTATIF À BASE DE COEFFICIENT DE REGROUPEMENT
(ZH) 一种基于集聚系数的自适应聚类方法及系统
Abrégé
(EN)
Provided is a clustering coefficient-based adaptive clustering method, comprising: according to the categories of extracted data point pairs and the size of connection relations between data points extracted each time, determining to which categories the data points belong, and the number of categories, and establishing connection relations between data points and connection relations between categories; pre-segmenting each category and calculating the intra-category similarity and inter-category similarity of two sub-categories; determining whether the two pre-segmented sub-categories satisfy a segmentation condition; if so, then accepting the pre-segmentation; if not, then cancelling the pre-segmentation; calculating the intra-category similarity and inter-category similarity of two categories having an connection relation and determining whether the two categories satisfy a merging condition; if so, then merging the two categories to generate a new category; if not, then cancelling the merge. The present invention takes into consideration for the first time the relations between data points in a category, and calculates intra-category similarity and inter-category similarity on the basis of clustering coefficients, thus enabling data to be clustered more accurately.
(FR)
La présente invention concerne un procédé de regroupement adaptatif à base de coefficient de regroupement, consistant : selon les catégories de données extraites des paires de points de données extraites et la taille de relations de connexion entre des points de données extraits à chaque fois, à déterminer à quelles catégories les points de données appartiennent, et le nombre de catégories, et à établir des relations de connexion entre des points de données et des relations de connexion entre des catégories; à pré-segmenter chaque catégorie et à calculer la similarité intra-catégorie et la similarité inter-catégorie de deux sous-catégories; à déterminer si les deux sous-catégories pré-segmentées satisfont une condition de segmentation; si c'est le cas, à accepter alors la pré-segmentation; si ce n'est pas le cas, à annuler alors la pré-segmentation; à calculer la similarité intra-catégorie et la similarité inter-catégorie de deux catégories ayant une relation de connexion et à déterminer si les deux catégories satisfont une condition de fusion; si tel est le cas, à fusionner alors les deux catégories pour générer une nouvelle catégorie; si ce n'est pas le cas, à annuler alors la fusion. La présente invention prend en compte pour la première fois les relations entre des points de données dans une catégorie, et calcule une similarité intra-catégorie et une similarité inter-catégorie sur la base de coefficients de regroupement, permettant ainsi de regrouper des données de manière plus précise.
(ZH)
本发明提供一种基于集聚系数的自适应聚类方法,包括:根据已提取出的数据点对的属类和每次提取出的数据点间的关联关系的大小以确定数据点归于哪个属类,属类数目,建立数据点间的关联关系和属类间的关联关系;对每个属类进行预分割,计算两个子类的类内相似度和两个子类的类间相似度,判断预分割的两个子类是否满足分割条件,若是,则接收预分割;若否,则取消预分割;计算具有关联关系的两个属类的类内相似度和两个属类间的类间相似度,判断两个属类是否满足合并条件,若是,则合并两个属类生成新的属类;若否,则放弃合并。本发明首次将类中数据点两两之间的关系考虑进来,基于集聚系数计算类内相似程度和类间相似程度,使之更精确地集聚数据。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international