WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2016202918) PROCÉDÉ DE COMPRESSION DE DONNÉES GÉNOMIQUES
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2016/202918    N° de la demande internationale :    PCT/EP2016/063875
Date de publication : 22.12.2016 Date de dépôt international : 16.06.2016
CIB :
G06F 19/22 (2011.01)
Déposants : GOTTFRIED WILHELM LEIBNIZ UNIVERSITÄT HANNOVER [DE/DE]; Welfengarten 1 30167 Hannover (DE)
Inventeurs : MUNDERLOH, Marco; (DE).
VOGES, Jan; (DE).
OSTERMANN, Jörn; (DE)
Mandataire : GRAMM, LINS & PARTNER PATENT- UND RECHTSANWÄLTE PARTGMBB; Freundallee 13a 30173 Hannover (DE)
Données relatives à la priorité :
62/180,146 16.06.2015 US
Titre (EN) METHOD FOR COMPRESSING GENOMIC DATA
(FR) PROCÉDÉ DE COMPRESSION DE DONNÉES GÉNOMIQUES
Abrégé : front page image
(EN)The present invention relates to a method for compressing genomic data, whereby the genomic data are stored in at least one data file containing at least a plurality of reads built by a genome sequencing method, whereby each read includes a mapping position, a CIGAR string and an actual sequenced nucleotide sequence as a local part of the donor genome, comprising the steps: - unwind a nucleotide sequence of a current read of one of said data files by using the mapping position and the CIGAR string of said current read, whereby said current read has at least one previous read, - compute a difference between the unwound nucleotide sequence of said current read and an unwound nucleotide sequence of at least one of said previous reads, whereby said difference contains the differences of the mapping positions and the nucleotide sequences, - pass said computed difference to an entropy coder to compress said difference, - encode said current read by the compressed difference, and - repeat the forgoing steps with said current read as one of said previous reads and a following read as a new current read until no more following reads are available.
(FR)La présente invention concerne un procédé permettant de compresser des données génomiques, où les données génomiques sont stockées dans au moins un fichier de données contenant au moins une pluralité de lectures construites par un procédé de séquençage de génome, où chaque lecture comprend une position de mappage, une chaîne CIGAR et une séquence de nucléotides séquencée réelle en tant que partie locale du génome de donneur, comprenant les étapes suivantes : - dérouler une séquence de nucléotides d'une lecture actuelle d'un desdits fichiers de données en utilisant la position de mappage et la chaîne CIGAR de ladite lecture actuelle, où ladite lecture actuelle a au moins une lecture précédente, - calculer une différence entre la séquence de nucléotides déroulée de ladite lecture actuelle et une séquence de nucléotides déroulée d'au moins une desdites lectures précédentes, où ladite différence contient les différences des positions de mappage et des séquences de nucléotides, - passer ladite différence calculée à un codeur entropique pour compresser ladite différence, - encoder ladite lecture actuelle par la différence compressée, et - répéter les étapes précédentes en utilisant ladite lecture actuelle comme une desdites lectures précédentes et une lecture suivante comme une nouvelle lecture actuelle jusqu'à ce qu'il n'y ait plus de lectures suivantes disponibles.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)