Processing

Please wait...

Settings

Settings

Goto Application

1. WO2019224666 - FINDING A RESOURCE IN RESPONSE TO A QUERY INCLUDING UNKNOWN WORDS

Publication Number WO/2019/224666
Publication Date 28.11.2019
International Application No. PCT/IB2019/054053
International Filing Date 16.05.2019
IPC
G06F 17/00 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
CPC
G06F 16/3334
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
3332Query translation
3334Selection or weighting of terms from queries, including natural language queries
G06F 16/3344
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
3331Query processing
334Query execution
3344using natural language analysis
G06F 16/374
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
36Creation of semantic tools, e.g. ontology or thesauri
374Thesaurus
G06F 16/951
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
951Indexing; Web crawling techniques
G06F 40/242
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
237Lexical tools
242Dictionaries
G06F 40/268
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
268Morphological analysis
Applicants
  • INTERNATIONAL BUSINESS MACHINES CORPORATION [US]/[US]
  • IBM UNITED KINGDOM LIMITED [GB]/[GB] (MG)
  • IBM (CHINA) INVESTMENT COMPANY LIMITED [CN]/[CN] (MG)
Inventors
  • OYA, Hiroki
Agents
  • FOURNIER, Kevin
Priority Data
15/986,81323.05.2018US
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) FINDING A RESOURCE IN RESPONSE TO A QUERY INCLUDING UNKNOWN WORDS
(FR) IDENTIFICATION D'UNE RESSOURCE EN RÉACTION À UNE REQUÊTE INCLUANT DES MOTS INCONNUS
Abstract
(EN) A computer receives a search query from a user for finding a resource. The computer extracts one or more words from the search query using morphological analysis. The computer assigns at least one first category to at least one first word of the one or more words using a dictionary. In response to identifying an unknown word not in the dictionary within the one or more words, the computer searches for the unknown word on a net. If the unknown word is found on the net, the computer obtains a description on a page on the net on which the unknown word is found, extracts one or more second words from the description using morphological analysis, assigns, using the dictionary, at least one second category to the one or more second words extracted from the description, finds, among the one or more second words, a particular word to which a predetermined category was assigned, extracts a correlation word from among the one or more second words having a high correlation with the found particular word, and finds, among the first words, a search word assigned the at least one first category that is the same as the predetermined category, finds, from a repository, resource data or worksite data using the correlation word and the search word, and lists the found resource data.
(FR) Selon l'invention, un ordinateur reçoit une requête de recherche provenant d'un utilisateur pour trouver une ressource. L'ordinateur extrait un ou plusieurs mots de la requête de recherche à l'aide d'une analyse morphologique. L'ordinateur affecte au moins une première catégorie à au moins un premier mot parmi le ou les mots à l'aide d'un dictionnaire. En réaction à l'identification d'un mot inconnu ne figurant pas dans le dictionnaire à l'intérieur du ou des mots, l'ordinateur recherche le mot inconnu sur un réseau. Si le mot inconnu est trouvé sur le réseau, l'ordinateur obtient une description sur une page du réseau sur laquelle le mot inconnu est trouvé, extrait un ou plusieurs seconds mots de la description à l'aide d'une analyse morphologique, affecte, à l'aide du dictionnaire, au moins une seconde catégorie au(x) second(s) mots extraits de la description, trouve, parmi le ou les seconds mots, un mot particulier auquel une catégorie prédéterminée a été affectée, extrait un mot de corrélation parmi le ou les seconds mots présentant une corrélation élevée avec le mot particulier trouvé, et trouver, parmi les premiers mots, un mot de recherche affecté à la ou aux premières catégories identiques à la catégorie prédéterminée, trouver, à partir d'un référentiel, des données de ressources ou des données de site de travail en utilisant le mot de corrélation et le mot de recherche, et énumère les données de ressources trouvées.
Related patent documents
GB2018171.5This application is not viewable in PATENTSCOPE because the national phase entry has not been published yet or the national entry is issued from a country that does not share data with WIPO or there is a formatting issue or an unavailability of the application.
Latest bibliographic data on file with the International Bureau