WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2002010982) SYSTEME INFORMATIQUE PERMETTANT DE COLLECTER DES INFORMATIONS PROVENANT DE SITES WEB
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2002/010982    N° de la demande internationale :    PCT/US2001/022426
Date de publication : 07.02.2002 Date de dépôt international : 17.07.2001
Demande présentée en vertu du Chapitre 2 :    11.02.2002    
CIB :
G06F 17/30 (2006.01)
Déposants : ELIYON TECHNOLOGIES CORPORATION [US/US]; 810 Memorial Drive Cambridge, MA 02139 (US)
Inventeurs : STERN, Jonathan; (US).
KARADIMITRIOU, Kosmas; (US).
DECARY, Michel; (CA).
ROTHMAN-SHORE, Jeremy, W.; (US)
Mandataire : WAKIMURA, Mary, Lou à; Hamilton, Brook, Smith & Reynolds, P.C. 530 Virginia Road P.O. Box 9133, Concord Massachusetts 01742-9133 (US)
Données relatives à la priorité :
60/221,750 31.07.2000 US
Titre (EN) COMPUTER SYSTEM FOR COLLECTING INFORMATION FROM WEB SITES
(FR) SYSTEME INFORMATIQUE PERMETTANT DE COLLECTER DES INFORMATIONS PROVENANT DE SITES WEB
Abrégé : front page image
(EN)Computer processing means and method for searching and retrieving Web pages to collect people and organization information are disclosed. A Web site of potential interest is accessed. A subset of Web pages from the accessed site are determined for processing. According to types of contents found on a subject Web page, extraction of people and organization information is enabled. Internal links of a Web site are collected and recorded in a links-to-visit table. To avoid duplicate processing of Web sites, unique identifiers or Web site signatures are utilized. Respective time thresholds (time-outs) for processing a Web site and for processing a Web page are employed. A database is maintained for storing indications of domain URL's, names of respective owners of the URL's as identified from the corresponding Web sites, type of each Web site, processing frequencies, dates of last processings, outcomes of last processings, size of each domain and number of data items founds in last processing of each Web site.
(FR)L'invention concerne des moyens de traitement informatique et un procédé permettant de rechercher et d'extraire des pages Web afin de collecter des informations relatives à des personnes et des organisations. On accède à un site Web d'intérêt potentiel. On détermine un sous-ensemble de pages Web provenant du site auquel on a accédé afin de le traiter. En fonction des types de contenus trouvés sur une page Web de sujets, il est possible d'extraire des informations relatives à des personnes et à des organisations. On collecte et on enregistre des liaisons internes de site Web dans une table de liaisons à visiter. Afin d'éviter un double traitement des sites Web, on utilise des identificateurs ou des signatures de pages Web uniques. On utilise des seuils temporels (temporisations) respectifs pour traiter un site et une page Web. Une base de données est gérée de façon à stocker des indications d'URL de domaines, les noms des propriétaires respectifs des URL tels qu'ils sont identifiés à partir des sites Web correspondants, le type de chaque site Web, le traitement de fréquences, les dates des derniers traitements, les résultats des derniers traitements, la taille de chaque domaine, et le nombre d'articles de données trouvés dans le dernier traitement de chaque site Web.
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)