Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2007149623 - SYSTÈMES DE RECHERCHE ET D'INTERROGATION PORTANT SUR DU TEXTE INTÉGRAL ET PROCÉDÉ D'UTILISATION

Numéro de publication WO/2007/149623
Date de publication 27.12.2007
N° de la demande internationale PCT/US2007/067439
Date du dépôt international 25.04.2007
CIB
G06F 7/00 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
7Méthodes ou dispositions pour le traitement de données en agissant sur l'ordre ou le contenu des données manipulées
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/334
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
334Query execution
Déposants
  • INFOVELL, INC. [US/US]; 4600 Bohannon Drive, Suite 220 Menlo Park, CA 94025, US (AllExceptUS)
  • TANG, Yuanhua, Tom [US/US]; US (UsOnly)
  • HU, Qianjin [US/US]; US (UsOnly)
  • YANG, Yonghong, Grace [US/US]; US (UsOnly)
  • CHEN, Chunnuan [CN/US]; US (UsOnly)
  • MEI, Minghua [CN/CN]; CN (UsOnly)
Inventeurs
  • TANG, Yuanhua, Tom; US
  • HU, Qianjin; US
  • YANG, Yonghong, Grace; US
  • CHEN, Chunnuan; US
  • MEI, Minghua; CN
Mandataires
  • WOLFELD, Warren, S. ; Haynes Beffel & Wolfeld LLP P.O. Box 366 Half Moon Bay, CA 94019, US
Données relatives à la priorité
60/745,60425.04.2006US
60/745,60525.04.2006US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) FULL TEXT QUERY AND SEARCH SYSTEMS AND METHOD OF USE
(FR) SYSTÈMES DE RECHERCHE ET D'INTERROGATION PORTANT SUR DU TEXTE INTÉGRAL ET PROCÉDÉ D'UTILISATION
Abrégé
(EN)
Roughly described, a database searching method for searching a database, in which hits are ranked in dependence upon an information measure of itoms shared by both the hit and the query. The information measure can be a Shannon information score, or another measure which indicates the information value of the shared itoms. An itom can be a word or other token, or a multi-word phrase, and can overlap with each other. Synonyms can be substituted for itoms in the query, with the information measure of substituted itoms being derated in accordance with a predetermined measure of the synonyms' similarity. Indirect searching methods are described in which hit from other search engines are re-ranked in dependence upon the information measures of shared itoms. Structured and completely unstructured databases may be searched, with hits being demarcated dynamically. Hits may be clustered based upon distances in an information- measure- weighted distance space.
(FR)
La présente invention concerne un procédé de recherche de base de données destiné à la recherche dans une base de données, dans lequel on classe les réponses en fonction d'une mesure d'information d'éléments partagés par la réponse et l'interrogation. La mesure d'information peut être un score de mesure de l'information de Shannon, ou une autre mesure qui indique la valeur d'information des éléments partagés. Un élément peut être un mot ou un autre jeton, ou une phrase de plusieurs mots, et peut en chevaucher d'autres. On peut substituer des synonymes à des éléments dans l'interrogation, la valeur nominale de la mesure d'information des éléments substitués étant réduite en fonction d'une mesure prédéterminée de la similarité des synonymes. L'invention concerne également des procédés de recherche indirecte dans lesquels des réponses d'autres moteurs de recherche sont reclassées en fonction des mesures d'information d'éléments partagés. On peut faire une recherche dans des bases de données structurées et complètement non structurées, les réponses étant démarquées dynamiquement. Il est possible de regrouper les réponses selon des distances dans un espace de distance pondéré par une information ou une mesure.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international