WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2010014956) CODAGE EFFICACE DE DONNEES BASE SUR DES COLONNES POUR STOCKAGE DE DONNEES A GRANDE ECHELLE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2010/014956    N° de la demande internationale :    PCT/US2009/052491
Date de publication : 04.02.2010 Date de dépôt international : 31.07.2009
CIB :
G06F 7/76 (2006.01), G06F 7/78 (2006.01)
Déposants : MICROSOFT CORPORATION [US/US]; One Microsoft Way Redmond, WA 98052-6399 (US) (Tous Sauf US)
Inventeurs : NETZ, Amir; (US).
PETCULESCU, Cristian; (US).
CRIVAT, Ioan, Bogdan; (US)
Données relatives à la priorité :
61/085,023 31.07.2008 US
12/270,873 14.11.2008 US
Titre (EN) EFFICIENT COLUMN BASED DATA ENCODING FOR LARGE-SCALE DATA STORAGE
(FR) CODAGE EFFICACE DE DONNEES BASE SUR DES COLONNES POUR STOCKAGE DE DONNEES A GRANDE ECHELLE
Abrégé : front page image
(EN)The subject disclosure relates to column based data encoding where raw data to be compressed is organized by columns, and then, as first and second layers of reduction of the data size, dictionary encoding and/or value encoding are applied to the data as organized by columns, to create integer sequences that correspond to the columns. Next, a hybrid greedy run length encoding and bit packing compression algorithm further compacts the data according to an analysis of bit savings. Synergy of the hybrid data reduction techniques in concert with the column-based organization, coupled with gains in scanning and querying efficiency owing to the representation of the compact data, results in substantially improved data compression at a fraction of the cost of conventional systems.
(FR)L’invention concerne un codage de données basé sur des colonnes, dans lequel des données brutes à comprimer sont organisées par colonnes, puis dans lequel, sous la forme de première et deuxième couches de réduction de la taille des données, un codage de dictionnaire et/ou un codage de valeurs est/sont appliqué(s) sur les données organisées en colonnes, de sorte à créer des séquences d’entiers qui correspondent aux colonnes. Ensuite, un algorithme glouton hybride de codage par longueur de plage et de compression de bits compacte plus encore les données en fonction d’une analyse de sauvegarde de bits. La synergie des techniques hybrides de réduction de données, associée à l’organisation par colonnes et couplée aux gains d’efficacité de balayage et de traitement de requête liés à la représentation des données compactes, permet d’obtenir une compression de données sensiblement améliorée, pour une fraction du coût des systèmes classiques.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)