Processing

Please wait...

Settings

Settings

1. WO2011075610 - SYSTEM AND METHOD FOR CREATING A DE-DUPLICATED DATA SET

Publication Number WO/2011/075610
Publication Date 23.06.2011
International Application No. PCT/US2010/060899
International Filing Date 16.12.2010
IPC
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
11
Error detection; Error correction; Monitoring
07
Responding to the occurrence of a fault, e.g. fault tolerance
14
Error detection or correction of the data by redundancy in operation, e.g. by using different operation sequences leading to the same result
G06F 17/30 (2006.01)
G06F 11/14 (2006.01)
CPC
G06F 11/1451
G06F 11/1453
G06F 11/1458
G06F 16/137
G06F 16/1748
G06F 2201/80
Applicants
  • RENEW DATA CORP. [US/US]; 9500 Arboretum Blvd. Suite 130 Austin, TX 78759, US (AllExceptUS)
  • PENDLEBURY, Kenneth, C. [US/US]; US (UsOnly)
  • PRATT, Christopher [US/US]; US (UsOnly)
  • JONES, Terence, C. [US/US]; US (UsOnly)
  • OMBERG, Erik, J. [US/US]; US (UsOnly)
  • MARSH, John, A. [US/US]; US (UsOnly)
  • REESE, Christopher, D. [US/US]; US (UsOnly)
Inventors
  • PENDLEBURY, Kenneth, C.; US
  • PRATT, Christopher; US
  • JONES, Terence, C.; US
  • OMBERG, Erik, J.; US
  • MARSH, John, A.; US
  • REESE, Christopher, D.; US
Agents
  • KUYPER, Reena; Berry & Associates P.C. 9229 Sunset Blvd. Suite 630 Los Angeles, CA 90069, US
Priority Data
61/287,17516.12.2009US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SYSTEM AND METHOD FOR CREATING A DE-DUPLICATED DATA SET
(FR) SYSTÈME ET PROCÉDÉ PERMETTANT DE CRÉER UN JEU DE DONNÉES DÉDUPLIQUÉ
Abstract
(EN)
The present invention is directed to a system and method for creating a non- redundant data set from a plurality of data sources. Generally, the system and method operate by creating unique hash keys corresponding to unique data files; compiling the hash keys along with seeking information for the corresponding data files; de-duplicating the hash keys; and retrieving/storing the data files corresponding to the de-duplicated hash keys. Thus, in accordance with the system and method of the present invention, a non- redundant data set can be created from a plurality of data sources. The system of the present invention can operate independently or in conjunction with any de-duplicating methods and systems. For example, a de-duplicating method and system can be used to read and obtain data from a variety of media, regardless of the application used to generate the backup media. The component parts of a file may be read from a medium, including content and metadata pertaining to a file. These pieces of content and metadata may then be stored and associated. To avoid duplication of data, pieces of content and metadata may be compared to previously stored content and metadata. Furthermore, using these same methods and systems the content and metadata of a file may be associated with a location where the file resided. A database which stores these components and allows linking between the various stored components may be particularly useful in implementing embodiments of these methods and systems.
(FR)
La présente invention concerne un système et un procédé permettant de créer un jeu de données non redondant issu d'une pluralité de sources de données. De manière générale, le système et le procédé fonctionnent en créant des clés de hachage uniques correspondant à des fichiers de données uniques ; en compilant des clés de hachage conjointement avec des informations de recherche pour des fichiers de données correspondants ; en dédupliquant des clés de hachage ; et en récupérant/en stockant des fichiers de données correspondant aux clés de hachage dédupliquées. Ainsi, en conformité avec le système et le procédé de la présente invention, un jeu de données non redondant peut être créé à partir d'une pluralité de sources de données. Le système de la présente invention peut fonctionner indépendamment ou conjointement avec tout procédé et système de déduplication. Par exemple, un procédé et un système de déduplication peuvent être utilisés pour lire et pour obtenir des données à partir d'une variété de média, indépendamment de l'application utilisée pour générer le média de secours. Les parties composantes d'un fichier peuvent être lues à partir d'un support, comprenant un contenu et des métadonnées appartenant à un fichier. Ces éléments de contenu et métadonnées peuvent ensuite être stockés et associés. Pour éviter une duplication de données, les éléments de contenu et les métadonnées peuvent être comparés à du contenu et des métadonnées stockés antérieurement. De plus, au moyen des mêmes procédés et systèmes, le contenu et les métadonnées d'un fichier peuvent être associés à un emplacement où le fichier résidait. Une base de données qui stocke ces composants et permet une liaison entre divers composants stockés peut être particulièrement utile dans l'implémentation des modes de réalisation de ces procédés et systèmes.
Latest bibliographic data on file with the International Bureau