WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2013178993) SYSTÈME ET PROCÉDÉ D'EXTRACTION DE DONNÉES BRUTES
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2013/178993    N° de la demande internationale :    PCT/GB2013/051341
Date de publication : 05.12.2013 Date de dépôt international : 22.05.2013
CIB :
G06F 17/22 (2006.01), G06F 17/30 (2006.01)
Déposants : VAN MOLENDORFF, Steffan Ockert [GB/GB]; (GB)
Inventeurs : VAN MOLENDORFF, Steffan Ockert; (GB)
Mandataire : HOARTON, Lloyd; Forresters Sherborne House 119-121 Cannon Street London Greater London EC4N 5AT (GB)
Données relatives à la priorité :
1209471.0 29.05.2012 GB
Titre (EN) A SYSTEM AND METHOD OF EXTRACTING RAW DATA
(FR) SYSTÈME ET PROCÉDÉ D'EXTRACTION DE DONNÉES BRUTES
Abrégé : front page image
(EN)A system and corresponding method to extract raw data from an electronic text document in a predetermined format (particularly XML format), the document comprising raw data in the form of tag data held in a hierarchical framework formed from a plurality of tag sets, wherein the system comprises: a tag analysis module operable to analyse the formatted document to identify: a plurality of tags in the hierarchical framework; and the tag data in the hierarchical framework;a grouping module operable to group at least two of the plurality of tags, wherein the at least two tags are grouped into a tag set, each tag set having a tag index specifying the location of the tag set in the hierarchical framework of the document; and an output module operable to associate a tag set with the tag data of that tag set.
(FR)L'invention se rapporte à un système et à un procédé correspondant conçus pour extraire des données brutes d'un document texte électronique ayant un format prédéfini (en particulier un format XML), ledit document comportant des données brutes sous la forme de données de balises conservées dans un cadre hiérarchique constitué d'une pluralité d'ensembles de balises. Le système comprend : un module d'analyse de balises servant à analyser le document formaté afin d'identifier une pluralité de balises dans le cadre hiérarchique ainsi que les données de balises contenues dans ledit cadre hiérarchique ; un module de regroupement prévu pour regrouper au moins deux balises de la pluralité de balises, ces balises étant regroupées en un ensemble de balises et chaque ensemble de balises ayant un index de balises qui indique la localisation de l'ensemble de balises dans le cadre hiérarchique du document ; et un module de sortie destiné à associer un ensemble de balises aux données de balises de cet ensemble de balises.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)