WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2010078475) PROCÉDÉS ET SYSTÈME DE RECONSTRUCTION DE DOCUMENT
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2010/078475    N° de la demande internationale :    PCT/US2009/069885
Date de publication : 08.07.2010 Date de dépôt international : 31.12.2009
CIB :
G06F 17/27 (2006.01)
Déposants : APPLE INC. [US/US]; 1 Infinite Loop, M/s 40-pat Cupertino, CA 95014 (US) (Tous Sauf US).
MANSFIELD, Philip, Andrew [CA/CA]; (CA) (US Seulement).
LEVY, Michael, Robert [CA/CA]; (CA) (US Seulement).
CLEGG, Derek, B. [US/US]; (US) (US Seulement)
Inventeurs : MANSFIELD, Philip, Andrew; (CA).
LEVY, Michael, Robert; (CA).
CLEGG, Derek, B.; (US)
Mandataire : ADELI, Mani; Adeli & Tollen LLP 11940 San Vicente Blvd., Suite 100 Los Angeles, CA 90049 (US)
Données relatives à la priorité :
12/479,847 07.06.2009 US
12/479,848 07.06.2009 US
12/479,849 07.06.2009 US
12/479,845 07.06.2009 US
61/142,329 02.01.2009 US
12/479,850 07.06.2009 US
12/455,866 07.06.2009 US
12/479,852 07.06.2009 US
12/479,843 07.06.2009 US
12/479,844 07.06.2009 US
12/479,842 07.06.2009 US
Titre (EN) METHODS AND SYSTEM FOR DOCUMENT RECONSTRUCTION
(FR) PROCÉDÉS ET SYSTÈME DE RECONSTRUCTION DE DOCUMENT
Abrégé : front page image
(EN)Different embodiments of the invention use different techniques for analyzing an unstructured document to define a structured document. The unstructured document includes numerous primitive elements, but does not include structural elements that specify the structural relationship between the primitive elements and/or structural attributes of the document based on these primitive elements. To define the structured document, the primitive elements of the unstructured document are used to identify various geometric attributes of the unstructured document. The identified geometric attributes and other attributes of the primitive elements are used to define structural elements, such as associated primitive elements (e.g., words, paragraphs, joined graphs, etc.), tables, guides, gutters, etc, as well as to define the flow of reading through the primitive and structural elements. Various methods to enhance the efficiency of the geometric analysis and document reconstruction processes, ( e.g., hierarchical profiling, efficient cluster analysis techniques, efficient data structures) are provided.
(FR)Différents modes de réalisation de l'invention utilisent différentes techniques pour analyser un document non structuré pour définir un document structuré. Le document non structuré comprend de nombreux éléments primitifs, mais ne comprend pas d'éléments structuraux qui spécifient la relation structurale entre les éléments primitifs et/ou des attributs structuraux du document sur la base de ces éléments primitifs. Pour définir le document structuré, les éléments primitifs du document non structuré sont utilisés pour identifier divers attributs géométriques du document non structuré. Les attributs géométriques identifiés et d'autres attributs des éléments primitifs sont utilisés pour définir des éléments structuraux, tels que des éléments primitifs associés (par exemple, des mots, paragraphes, graphiques joints, etc.), des tableaux, des guides, intercalaires colonnes, etc., ainsi que pour définir le flux de lecture à travers les éléments primitifs et structuraux. L'invention porte sur divers procédés pour améliorer l'efficacité des processus d'analyse géométrique et de reconstruction de document (par exemple, profilage hiérarchique, techniques d'analyse par groupe efficaces, structures de données efficaces).
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)