Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2007139610 - indexation de documents pour la rÉcupération d'informations

Numéro de publication WO/2007/139610
Date de publication 06.12.2007
N° de la demande internationale PCT/US2007/006600
Date du dépôt international 15.03.2007
CIB
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
G06F 17/21 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
21Traitement de texte
CPC
G06F 16/3326
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
332Query formulation
3325Reformulation based on results of preceding query
3326using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
G06F 16/951
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
951Indexing; Web crawling techniques
Déposants
  • MICROSOFT CORPORATION; One Microsoft Way Redmond, WA 98052-6399, US (AllExceptUS)
  • TAYLOR, Michael J. [GB/GB]; US (UsOnly)
  • ROBERTSON, Stephen [GB/GB]; US (UsOnly)
  • WILLIAMS, Hugh E. [AU/US]; US (UsOnly)
  • CRASWELL, Nicholas E. [AU/GB]; US (UsOnly)
Inventeurs
  • TAYLOR, Michael J.; US
  • ROBERTSON, Stephen; US
  • WILLIAMS, Hugh E.; US
  • CRASWELL, Nicholas E.; US
Données relatives à la priorité
06114850.801.06.2006EP
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) INDEXING DOCUMENTS FOR INFORMATION RETRIEVAL
(FR) indexation de documents pour la rÉcupération d'informations
Abrégé
(EN)
Information retrieval systems such as web search systems locate documents amongst millions and even billions of possible documents on the basis of query terms. In order to achieve this document indexes are created. We propose creating new fields in the documents to store feedback information. This information comprises query terms used in a particular search as well as information about whether a particular document retrieved is given positive or negative feedback for example. Indexes are created on the basis of this feedback information in addition to other available information. As a result relevance of search results is improved. Multiple fields of information are available for given documents (such as abstract fields, title fields, anchor text fields as well as our feedback fields). Any search algorithm which deals with multiple fields as well as multiple query terms and which provides for differential weighting of document fields is used.
(FR)
L'invention concerne des systèmes de récupération d'informations tels que des systèmes de recherche Web qui localisent des documents parmi des millions et même des milliards de documents possibles sur la base de termes d'interrogation. Afin d'obtenir ce document, des index sont créés. Nous proposons la création de nouveaux champs dans les documents pour stocker des informations de retour. Ces informations comprennent des termes d'interrogation utilisés dans une recherche particulière ainsi que des informations afin de savoir si un document particulier récupéré a donné un retour positif ou négatif par exemple. Des index sont créés sur la base de ces informations de retour en plus d'autres informations disponibles. En conséquence, la pertinence des résultats de recherche est améliorée. Des champs multiples d'informations sont disponibles pour des documents donnés (tels que des champs de résumé, des champs de titre, des champs de texte d'ancrage ainsi que nos champs de retour). Un algorithme de recherche quelconque qui traite des champs multiples ainsi que des termes d'interrogation multiples et qui permet d'obtenir la pondération différentielle de champs de document est utilisé.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international