Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2016188051) PROCÉDÉ D'APPARIEMENT DE NOMS D'OBJETS BASÉ SUR L'ENTROPIE D'INFORMATION.
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication : WO/2016/188051 N° de la demande internationale : PCT/CN2015/094379
Date de publication : 01.12.2016 Date de dépôt international : 12.11.2015
CIB :
G06F 17/27 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20
Manipulation de données en langage naturel
27
Analyse automatique, p.ex. analyse grammaticale, correction orthographique
Déposants :
深圳市华傲数据技术有限公司 SHENZHEN AUDAQUE DATA TECHNOLOGY LTD [CN/CN]; 中国广东省深圳市 南山区高新区中区高新中一道9号软件大厦7层713、715、716室 Room 713, 715, 716, Floor 7, Software Building, No. 9, High-tech Middle 1 Road, High-tech Zone Middle, Nanshan District Shenzhen, Guangdong 518057, CN
Inventeurs :
王明兴 WANG, Mingxing; CN
贾西贝 JIA, Xibei; CN
Mandataire :
深圳鼎合诚知识产权代理有限公司 DHC IP ATTORNEYS; 中国广东省深圳市 福田区金田路与福华路交汇处现代国际大厦2201 Suite 2201, Modern International Commercial Building, Cross of Fuhua Road and Jintian Road Futian District, Shenzhen, Guangdong 518048, CN
Données relatives à la priorité :
201510280012.927.05.2015CN
Titre (EN) INFORMATION ENTROPY-BASED OBJECT NAME MATCHING METHOD
(FR) PROCÉDÉ D'APPARIEMENT DE NOMS D'OBJETS BASÉ SUR L'ENTROPIE D'INFORMATION.
(ZH) 基于信息熵的对象名称匹配方法
Abrégé :
(EN) An information entropy-based object name matching method. The method comprises: step 10. collecting all object names to be identified (10); step 20. calculating information entropy of each character (20); step 30. respectively converting a first object name and a second object name into a first and a second Q-Gram character string sequence (30); step 40. calculating information entropy of each Q-Gram character string within a union of the first and the second Q-Gram character string sequence (40); step 50. obtaining the total entropy (totalEntropy) of information entropy of all Q-Gram character strings within the first and the second Q-Gram character string sequence, and initializing a total information entropy difference of the first object name and the second object name to be zero (50); step (60). with regard to each q-Gram character string token and information entropy thereof in the union, calculating an information entropy difference corresponding to the token, and adding same to the total information entropy difference (60); and step (70) calculating a similarity degree of the first object name and the second object name (70). The information entropy-based object name matching method can effectively identify a similarity degree of two object names.
(FR) La présente invention concerne un procédé d'appariement de noms d'objets basé sur l'entropie d'information. Le procédé comprend les étapes suivantes : étape 10. collecter tous les noms d'objets à identifier (10) ; étape 20. calculer une entropie d'information de chaque caractère (20) ; étape 30. convertir respectivement un premier nom d'objet et un second nom d'objet en une première et une seconde séquence de chaînes de caractères Q-Gram (30) ; étape 40. calculer une entropie d'information de chaque chaîne de caractères Q-Gram au sein d'une union de la première et de la seconde séquence de chaînes de caractères Q-Gram (40) ; étape 50. obtenir l'entropie totale (totalEntropy) de l'entropie d'information de toutes les chaînes de caractères Q-Gram dans la première et la seconde séquence de chaînes de caractères Q-Gram, et initialiser une différence d'entropie d'information totale du premier nom d'objet et du second nom d'objet pour qu'elle soit nulle (50) ; étape (60). pour chaque jeton de chaîne de caractères Q-Gram et son entropie d'information au sein de l'union, calculer une différence d'entropie d'information correspondant au jeton, et ajouter celle-ci à la différence d'entropie d'information totale (60) ; et étape (70) calculer un degré de similitude du premier nom d'objet et du second nom d'objet (70). Le procédé d'appariement de noms d'objets basé sur l'entropie d'information peut identifier de manière efficace un degré de similitude de deux noms d'objets.
(ZH) 一种基于信息熵的对象名称匹配方法。该方法包括:步骤10、收集所有待识别对象名称(10);步骤20、计算每个字符的信息熵(20);步骤30、将第一对象名称和第二对象名称分别转换为第一和第二Q-Gram字符串序列(30);步骤40、计算该第一和第二Q-Gram字符串序列的并集内每个Q-Gram字符串的信息熵(40);步骤50、求该第一和第二Q-Gram字符串序列内所有Q-Gram字符串的信息熵的总和totalEntropy,初始化该第一对象名称和第二对象名称的总信息熵差difference为0(50);步骤60、对于该并集内每个q-Gram字符串token及其信息熵entropy,计算token对应的信息熵差,并加到总信息熵差difference上(60);步骤70、计算该第一对象名称和第二对象名称的相似度(70)。基于信息熵的对象名称匹配方法能够有效识别两个对象名称之间的相似度。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)