WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018095411) PROCÉDÉ ET DISPOSITIF DE REGROUPEMENT DE PAGE WEB
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2018/095411    N° de la demande internationale :    PCT/CN2017/112883
Date de publication : 31.05.2018 Date de dépôt international : 24.11.2017
CIB :
G06F 17/30 (2006.01)
Déposants : NSFOCUS INFORMATION TECHNOLOGY CO., LTD. [CN/CN]; 3F, Ether Building, No. 4 Beiwa Rd., Haidian District Beijing 100089 (CN).
NSFOCUS TECHNOLOGIES, INC. [CN/CN]; 3F, Ether Building, No. 4 Beiwa Rd., Haidian District Beijing 100089 (CN)
Inventeurs : GUO, Yangyang; (CN).
LIU, Shaobin; (CN).
LI, Fei; (CN).
LI, Hu; (CN).
LIU, Lijun; (CN)
Mandataire : TDIP & PARTNERS; 101-01, 8/F, Building 20, No.1 Baosheng South Road Haidian District Beijing 100192 (CN)
Données relatives à la priorité :
201611068233.0 25.11.2016 CN
Titre (EN) WEB PAGE CLUSTERING METHOD AND DEVICE
(FR) PROCÉDÉ ET DISPOSITIF DE REGROUPEMENT DE PAGE WEB
(ZH) 一种网页聚类方法及装置
Abrégé : front page image
(EN)Disclosed by the present invention is a web page clustering method and device, used for clustering web pages according to a web page framework, the method comprising: acquiring uniform resource locators (URL) of a plurality of web pages to be clustered; for the URL of each web page to be clustered, determining rewriting rules of the URL and classifying the URL according to the rewriting rules of the URL; determining a web page framework of the web page corresponding to each URL in each URL class, and determining whether each URL may be clustered according to the web page framework of the web page corresponding to each URL; and retaining the URL class if each URL may be clustered. By means of said method, web pages having a same web page framework structure may be clustered into one class, thus solving the problem wherein an existing clustering method is incapable of clustering according to web page framework and providing a clustering method which is more applicable to a web page framework processing procedure.
(FR)La présente invention concerne un procédé et un dispositif de regroupement de pages web, utilisés pour regrouper des pages web selon un cadre de pages web, le procédé comprenant: acquérir des localisateur uniforme de ressource (URL) d'une pluralité de pages web à regrouper; pour l'URL de chaque page web à regrouper, à déterminer des règles de réécriture de l'URL et classifier l'URL en fonction des règles de réécriture de l'URL; déterminer un cadre de page web de la page web correspondant à chaque URL dans chaque classe d'URL, et déterminer si chaque URL peut être groupée en fonction du cadre de page web de la page web correspondant à chaque URL; et à retenir la classe d'URL si chaque URL peut être groupée. Au moyen dudit procédé, des pages web ayant une même structure de cadre de page web peuvent être regroupées en une classe, ce qui permet de résoudre le problème selon lequel un procédé de groupement existant est incapable de regrouper selon un cadre de page web et de fournir un procédé de groupement qui est plus applicable à une procédure de traitement de cadre de page web.
(ZH)本发明公开了一种网页聚类方法及装置,用于实现按照网页框架对网页进行聚类,包括:获取多个待聚类页面的统一资源定位符URL;针对每个待聚类页面的URL,确定该URL的重写规则并按照该URL的重写规则进行URL分类;针对每个URL分类,确定该URL分类中的各URL所对应的页面的页面框架,并根据各URL所对应的页面的页面框架确定各URL是否可聚类;若各URL可聚类,则保留该URL分类。通过上述方法,可以将具有相同页面框架结构的网页聚为一类,从而克服了现有聚类方法无法根据网页框架进行聚类的问题,提供了一种更适用于涉及页面框架的处理过程的聚类方法。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)