WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017185296) METHOD AND SYSTEM FOR DETECTING OUTLIER BASED ON MULTIPLE SUPPORT POINTS INDEX
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/185296    International Application No.:    PCT/CN2016/080505
Publication Date: 02.11.2017 International Filing Date: 28.04.2016
IPC:
G06F 17/30 (2006.01)
Applicants: SHENZHEN UNIVERSITY [CN/CN]; Nanhai Ave3688, Nanshan Shenzhen, Guangdong 518060 (CN)
Inventors: MAO, Rui; (CN).
XU, Honglong; (CN).
LU, Minhua; (CN).
LIAO, Hao; (CN).
LI, Ronghua; (CN).
WANG, Yi; (CN).
LIU, Gang; (CN)
Agent: HENSEN INTELLECTUAL PROPERTY FIRM; 10H Shangbu Building, No.68 Nanyuan Road, Futian Shenzhen, Guangdong 518000 (CN)
Priority Data:
Title (EN) METHOD AND SYSTEM FOR DETECTING OUTLIER BASED ON MULTIPLE SUPPORT POINTS INDEX
(FR) PROCÉDÉ ET SYSTÈME DE DÉTECTION D'UNE VALEUR ABERRANTE SUR LA BASE D'UN INDICE DE POINTS DE SUPPORT MULTIPLES
(ZH) 一种基于多支撑点索引的离群检测方法及其系统
Abstract: front page image
(EN)A method for detecting an outlier based on a multiple support points index, comprising: a support point selection step, of reading a data set, and selecting multiple support points from the data set to form a support point set (S11); an index establishment step, of calculating the distance between each object in the data set and the selected multiple support points, using the distance as a coordinate to form multi-dimensional data space, and establishing an index with the multi-dimensional data space (S12); an outlier detection step, of dividing the index into data blocks, and performing a detection on the data blocks for outliers, block by block (S13). Further provided is a system for detecting an outlier based on a multiple support points index. The technical solution avoids data space distortion caused by a single support point, by means of selecting multiple support points and performing distance calculations with a global data set to establish an index, preferably detecting all sparse areas in the data set, and being able to increase the outlier degree threshold more rapidly and improve the outlier detection speed.
(FR)L'invention concerne un procédé de détection d'une valeur aberrante sur la base d'un indice de points de support multiples, comprenant : une étape de sélection de points de support, consistant à lire un ensemble de données, et à sélectionner de multiples points de support à partir de l'ensemble de données pour former un ensemble de points de support (S11) ; une étape d'établissement d'indice, consistant à calculer la distance entre chaque objet dans l'ensemble de données et les multiples points de support sélectionnés, à utiliser la distance en tant que coordonnée pour former un espace de données multidimensionnel, et à établir un indice avec l'espace de données multidimensionnel (S12) ; une étape de détection de valeurs aberrantes, consistant à diviser l'indice en blocs de données, et à effectuer une détection de valeurs aberrantes sur les blocs de données, bloc par bloc (S13). L'invention concerne en outre un système permettant de détecter une valeur aberrante sur la base d'un indice de points de support multiples. La solution technique évite la distorsion de l'espace de données provoquée par un point de support unique, grâce à la sélection de multiples points de support et à la réalisation de calculs de distance avec un ensemble de données global pour établir un indice, de préférence grâce à la détection de toutes les zones peu denses dans l'ensemble de données, ce qui permet d'augmenter plus rapidement le seuil de degré d'une valeur aberrante et d'améliorer la vitesse de détection des valeurs aberrantes.
(ZH)一种基于多支撑点索引的离群检测方法,包括:选取支撑点步骤:读入数据集,在所述数据集中选取多个支撑点以形成支撑点集(S11);建立索引步骤:通过数据集中每个对象与所选取的多个支撑点计算距离并将距离作为坐标,形成多维数据空间,利用所述多维数据空间建立索引(S12);离群检测步骤:划分索引为数据块,并对所述数据块进行逐块检测离群点(S13)。还提供一种基于多支撑点索引的离群检测系统。本技术方案通过选取多个支撑点与全局数据集计算距离来建立索引,避免单支撑点导致的数据空间扭曲,对数据集中的所有稀疏区域优先检测,能更快地提升离群度阈值,提高离群检测速度。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)