WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2013119201) DE-DUPLICATION
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2013/119201    International Application No.:    PCT/US2012/024002
Publication Date: 15.08.2013 International Filing Date: 06.02.2012
IPC:
G11B 20/10 (2006.01), G11B 15/02 (2006.01)
Applicants: HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P. [US/US]; 11445 Compaq Center Drive W. Houston, Texas 77070 (US) (For All Designated States Except US).
HANA, Andrew [GB/GB]; (GB) (For US Only).
TREZISE, Gregory [GB/GB]; (GB) (For US Only)
Inventors: HANA, Andrew; (GB).
TREZISE, Gregory; (GB)
Agent: WEBB, Steven L; Hewlett-Packard Company Intellectual Property Administration 3404 East Harmony Road Mail Stop 35 Fort Collins, Colorado 80528 (US)
Priority Data:
Title (EN) DE-DUPLICATION
(FR) DÉDUPLICATION
Abstract: front page image
(EN)A method and apparatus for data de-duplication is disclosed. The de-duplication engine (DDE) divides data into regions. The DDE processes the regions in a serial fashion. The DDE clears its hash table before processing the first region. Each region is divided into a number of chunks. A hash is generated for each chunk in a region. When a hash for a chunk is not in a hash table, the hash is stored in the hash table and the chunk is stored on media. When the hash is a duplicate of a hash already in the table, the hash and chunk are discarded and a reference to the previously stored chunk is stored to the media. The DDE does not retain all the hashes from all the regions in the hash table at the same time. The DDE only retains the hashes for the current region being processed and N previous regions where N is a positive integer greater than zero.
(FR)La présente invention concerne un procédé et un dispositif de déduplication de données. Le moteur de déduplication (DDE) divise les données en régions. Le DDE traite les régions en mode série. Le DDE efface sa table de hachage avant de traiter la première région. Chaque région est divisée en un certain nombre de blocs. Un hachage est généré pour chaque bloc dans une région. Quand un hachage pour un bloc ne se trouve pas dans une table de hachage, le hachage est stocké dans la table de hachage, et le bloc est stocké sur un support. Lorsque le hachage est une copie d'un hachage déjà présent dans la table, le hachage et le bloc sont écartés et une référence au bloc précédemment stocké est stockée sur le support. Le DDE ne conserve pas tous les hachages de toutes les régions dans la table de hachage en même temps. Le DDE ne conserve que les hachages pour la région en cours de traitement et N régions précédentes où N est un entier positif supérieur à zéro.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)