WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2003065179) SYSTEME ET PROCEDE D'EXPLORATION EN PROFONDEUR DE DONNEES
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2003/065179    N° de la demande internationale :    PCT/US2003/003205
Date de publication : 07.08.2003 Date de dépôt international : 03.02.2003
CIB :
G06F 9/45 (2006.01), G06F 12/06 (2006.01), G06F 13/00 (2006.01), G06F 15/16 (2006.01), G06F 15/173 (2006.01), G06F 17/00 (2006.01), G06F 17/21 (2006.01), G06F 17/27 (2006.01), G06F 17/28 (2006.01), G06F 17/30 (2006.01), G06K 9/72 (2006.01), G06N 5/00 (2006.01)
Déposants : FAIRWEATHER, John [US/US]; (US)
Inventeurs : FAIRWEATHER, John; (US)
Mandataire : THIESSEN, Kendall, I.; Gibson, Dunn & Crutcher LLP, 1801 California Street, Suite 4100, Denver, CO 80202 (US)
Données relatives à la priorité :
60/353,487 01.02.2002 US
Titre (EN) A SYSTEM AND METHOD FOR MINING DATA
(FR) SYSTEME ET PROCEDE D'EXPLORATION EN PROFONDEUR DE DONNEES
Abrégé : front page image
(EN)A system and method for extracting data, hereinafter referred to as MitoMineTM, that produces a strongly-typed ontology defined collection referencing (and cross referencing) all extracted records. The input to the mining process can be any data source, such as a text file delimited into a set of possibly dissimilar records. Mitomine contains parser routines and post processing functions, known as 'munchers'. The parser routines can be accessed either via a batch mining process or as part of a running server process connected to a live source. Munchers can be registered on a per data-source basis in order to process the records produced, possibly writing them to an external database and/or a set of servers. The present invention also embeds an interpreted ontology based language within a compiler/interpreter (for the source format) such that the statements of the embedded language are executed as a result of the source compiler `recognizing' a given construct within the source and extracting the corresponding source content. In this way, the execution of the statements in the embedded program will occur in a sequence that is dictated wholly by the source content. This system and method therefore make it possible to bulk extract free-form data from such sources as CD-ROMs, the web etc. and have the resultant structured data loaded into an ontology based system.
(FR)L'invention concerne un système et un procédé d'extraction de données, ci-après dénommés 'MitoMineTM', qui permettent d'effectuer une collecte ontologique fortement typée fondée sur une vérification (et une contre-vérification) de tous les enregistrements explorés. Les données saisies pour le processus d'exploration peuvent être n'importe quelles données source, telles qu'un fichier textuel délimité en un ensemble d'enregistrements éventuellement dissemblables. 'Mitomine' contient des routines d'analyse et des fonctions de post-traitement, connues sous le nom de 'masticateurs'. On peut accéder aux routines d'analyse soit par un processus d'exploration par lot, soit par un élément d'un programme serveur en cours d'exécution connecté à une source active. Les'masticateurs'peuvent être enregistrés selon un système fondé sur les sources de données, aux fins de traiter les enregistrements extraits, en les écrivant éventuellement dans une base de données externe et/ou un ensemble de serveurs. L'invention intègre également un langage ontologique interprété dans un compilateur-interpréteur (pour le format source), qui fait que les instructions du langage intégré sont exécutées consécutivement à la 'reconnaissance' par le compilateur source d'une construction donnée à l'intérieur de la source, et à l'extraction du contenu source correspondant. Ainsi, l'exécution des instructions contenus dans le programme intégré s'effectue en une séquence dictée entièrement par le contenu source. Les système et procédé de l'invention permettent donc d'extraire en vrac des données à structure non imposée, à partir de sources telles que des CD-ROM, Internet, etc., et d'obtenir que les données structurées résultantes soient chargées dans un système ontologique.
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LU, MC, NL, PT, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)