Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2012012916 - SÉLECTION D'UN CONTENU PRINCIPAL DANS DES PAGES WEB

Numéro de publication WO/2012/012916
Date de publication 02.02.2012
N° de la demande internationale PCT/CN2010/001157
Date du dépôt international 30.07.2010
CIB
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/24578
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2457with adaptation to user needs
24578using ranking
G06F 40/258
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
258Heading extraction; Automatic titling; Numbering
Déposants
  • HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P. [US]/[US] (AllExceptUS)
  • LIM, Sukhwan [KR]/[US] (UsOnly)
  • ZHENG, Liwei [CN]/[CN] (UsOnly)
  • JIN, Jianming [CN]/[CN] (UsOnly)
  • HOU, Huiman [CN]/[CN] (UsOnly)
Inventeurs
  • LIM, Sukhwan
  • ZHENG, Liwei
  • JIN, Jianming
  • HOU, Huiman
Mandataires
  • CHINA PATENT AGENT (H.K.) LTD.
Données relatives à la priorité
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) SELECTION OF MAIN CONTENT IN WEB PAGES
(FR) SÉLECTION D'UN CONTENU PRINCIPAL DANS DES PAGES WEB
Abrégé
(EN)
A system and method for selecting main content (350) from web pages includes receiving a web page (205) by a web page analysis device (105) and scoring sub-trees (209) within the web page (205). The single sub-tree (225) with the highest final score is selected as the main content (350) of the webpage (205).
(FR)
Système et procédé de sélection d'un contenu principal (350) dans des pages Web, le procédé consistant à : recevoir une page Web (205) au moyen d'un dispositif d'analyse de page Web (105) et décerner un score à des sous-arborescences (209) au sein de la page Web (205) ; et sélectionner comme contenu principal (350) de la page Web (205) la sous-arborescence (225) dont le score final est le plus élevé.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international