WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2005067153) RAPIDLY QUERYABLE DATA COMPRESSION FORMAT FOR XML FILES
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2005/067153    International Application No.:    PCT/IB2004/052842
Publication Date: 21.07.2005 International Filing Date: 17.12.2004
IPC:
G06F 17/30 (2006.01), H03M 7/30 (2006.01), H03M 7/40 (2006.01)
Applicants: KONINKLIJKE PHILIPS ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1, NL-5621 BA Eindhoven (NL) (For All Designated States Except US).
MOREL, Anthoy [FR/CN]; (CN) (For US Only)
Inventors: MOREL, Anthoy; (CN)
Common
Representative:
KONINKLIJKE PHILIPS ELECTRONICS N.V.; c/o HAQUE, Azir, Philips Electronics China, 21/F Kerry, Office Building, 218 Tian Mu Xi Lu Road, Shanghai 200070 (CN)
Priority Data:
200310124520.5 30.12.2003 CN
Title (EN) RAPIDLY QUERYABLE DATA COMPRESSION FORMAT FOR XML FILES
(FR) FORMAT DE COMPRESSION DE DONNEES DE CONSULTATION RAPIDE POUR FICHIERS XML
Abstract: front page image
(EN)A method and device for XML compression with easy querying are provided. An XML file is parsed with a SAX-parser, useless characters such as tabulators and white spaces are removed, indicating data marks are inserted, LZ-77 compression is applied, and finally the data are Huffman-encoded and packed in data blocks. The indicating marks are used to search in the compresed file for tags or literals in the document, based e.g. on alphabetical order. The indicating marks consist of a special character such as a tab and an XML comment; hence they are XML-compatible. The organization of the compressed file in independent data blocks facilitates rapid querying and partial decompression of the compressed file.
(FR)L'invention concerne un procédé et un dispositif de compression XML de consultation aisée. Un fichier XML est analysé par un analyseur SAX ; les caractères inutiles tels que les tabulateurs et les blancs sont enlevés ; des marques de données indicatrices sont insérées ; la compression LZ-77 est appliquée et finalement les données sont codées Huffman et empaquetées dans des blocs de données. Les marques d'indication sont utilisées pour rechercher des étiquettes dans le fichier comprimé ou libellés dans le document, sur la base notamment d'un ordre alphabétique. Les marques d'indication consistent en un caractère spécial tel qu'un onglet et un commentaire XML et désormais elles sont compatibles XML. L'organisation du fichier comprimé dans les blocs de données indépendants facilite la consultation rapide et la décompression partielle du fichier comprimé.
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NA, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RU, SC, SD, SE, SG, SK, SL, SM, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IS, IT, LT, LU, MC, NL, PL, PT, RO, SE, SI, SK, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)