WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2000063783) METHOD AND SYSTEM FOR GENERATING STRUCTURED DATA FROM SEMI-STRUCTURED DATA SOURCES
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2000/063783    International Application No.:    PCT/US2000/007792
Publication Date: 26.10.2000 International Filing Date: 24.03.2000
Chapter 2 Demand Filed:    04.02.2002    
IPC:
G06F 17/27 (2006.01), G06F 17/30 (2006.01), G06K 9/62 (2006.01), G06K 9/72 (2006.01)
Applicants: LIAISON TECHNOLOGY, INC. [US/US]; Suite D400, 11044 Research Boulevard, Austin, TX 78759 (US)
Inventors: MIRANKER, Daniel, P.; (US).
OBERMEYER, L., Lance; (US).
NAVRATIL, Paul, A.; (US)
Agent: HULSEY, William, N., III; Gray Cary Ware & Freidenrich, Suite 1440, 100 Congress Avenue, Austin, TX 78701 (US)
Priority Data:
09/294,701 19.04.1999 US
Title (EN) METHOD AND SYSTEM FOR GENERATING STRUCTURED DATA FROM SEMI-STRUCTURED DATA SOURCES
(FR) PROCEDE ET SYSTEME D'OBTENTION DE DONNEES STRUCTUREES A PARTIR DE SOURCES DE DONNEES SEMI-STRUCTUREES
Abstract: front page image
(EN)A system and method for generating structured data outputs from a semi-structured data source. The steps of this method include generating an example output from an example generator (14). The example output is generated in response to the acquisition of a sequence of annotated strings (12). The annotated strings are generated in response to the acquisition and modification of at least one data example and corresponding coarse structure from a predetermined input source (10). Also, a second sequence of annotated strings is generated from input from a semi-structured data source (16). Both the example output and the second sequence of annotated strings are input to an acquisition engine (18) that implements a grammar layer incorporating a top-down parsing method and a comparison layer. The structured data outputs are generated through the cooperation of the comparison layer and the grammar layer (20).
(FR)Cette invention concerne un système et un procédé permettant d'obtenir des données structurées à partir d'une source de données semi-structurées. Cette démarche consiste à obtenir un exemple de production à partir d'un générateur type (14). Cet exemple de production résulte de l'obtention de chaînes annotées (12). Ces chaînes annotées sont générées en réponse à l'obtention et à la modification d'un moins un exemple de données et d'une structure brute provenant d'une source déterminée (10). De plus, on obtient une seconde séquence de chaînes annotées à partir d'une source de données semi-structurées (16). L'exemple de production comme la seconde séquence de chaînes annotées sont entrées dans un moteur d'acquisition (18) qui met en oeuvre une couche de grammaire comprenant une méthode d'analyse descendante et une couche de comparaison. C'est l'action conjointe de la couche de comparaison et de la couche de grammaire (20) qui permet d'obtenir des données structurées.
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CR, CU, CZ, DE, DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, SD, SL, SZ, TZ, UG, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)