Processing

Please wait...

Settings

Settings

Goto Application

1. WO2016124600 - METHOD OF TYPING NUCLEIC ACID OR AMINO ACID SEQUENCES BASED ON SEQUENCE ANALYSIS

Publication Number WO/2016/124600
Publication Date 11.08.2016
International Application No. PCT/EP2016/052187
International Filing Date 02.02.2016
IPC
G06F 19/22 2011.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
19Digital computing or data processing equipment or methods, specially adapted for specific applications
10Bioinformatics, i.e. methods or systems for genetic or protein-related data processing in computational molecular biology
22for sequence comparison involving nucleotides or amino acids, e.g. homology search, motif or Single-Nucleotide Polymorphism discovery or sequence alignment
C12Q 1/68 2006.01
CCHEMISTRY; METALLURGY
12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
1Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
68involving nucleic acids
CPC
C12Q 1/6869
CCHEMISTRY; METALLURGY
12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS
1Measuring or testing processes involving enzymes, nucleic acids or microorganisms
68involving nucleic acids
6869Methods for sequencing
G16B 20/00
GPHYSICS
16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
20ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Applicants
  • APPLIED MATHS
Inventors
  • POUSEELE, Hannes
  • JANSSENS, Koen
Agents
  • GEVERS PATENTS
Priority Data
15153406.202.02.2015EP
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) METHOD OF TYPING NUCLEIC ACID OR AMINO ACID SEQUENCES BASED ON SEQUENCE ANALYSIS
(FR) MÉTHODE DE TYPAGE D'ACIDES NUCLÉIQUES OU DE SÉQUENCES D'ACIDES AMINÉS SUR LA BASE D'UNE ANALYSE DE SÉQUENCE
Abstract
(EN)
The invention relates to a method for determining the presence or absence of predefined alleles in a set of read sequences, comprising: a) defining a k-mer, which is a nucleic acid sequence of a length "k", and a k-mer space which consists of all the permutations of nucleic acids (4k) with the selected length "k"; b) for each predefined allele, determining which k-mer is present in said predefined allele, thereby obtaining an allele-associated k-mer set; c) providing a set of read sequences;d) for each predefined allele and allele-associated k-mer set, determining the number of occurrences of each k-mer in said set of read sequences; e) filtering the determined number of occurrences of each k-mer; by resetting this number of occurrences of each k-mer to 0 if: i) the total number of occurrences is below a predefined threshold, ii) the total number of occurrences in the forward direction is below a predefined threshold, or iii) the total number of occurrences in the reverse direction is below a predefined threshold; f) determining the presence or absence of each predefined allele in the read sequences based on the filtered number of occurrences of each k-mer obtained from step e).
(FR)
L'invention concerne un procédé permettant de déterminer la présence ou l'absence d'allèles prédéfinis dans un ensemble de séquences lues, comprenant les étapes consistant à: a) définir un k-mère, qui est une séquence d'acide nucléique d'une longueur "k", et un espace k-mère qui est constitué de toutes les permutations d'acides nucléiques (4k) présentant la longueur sélectionnée "k"; b) pour chaque allèle prédéfinie, déterminer quel k-mère est présent dans ledit allèle prédéfini, ce qui permet d'obtenir un ensemble de k-mères associé à l'allèle; c) fournir un ensemble de séquences lues; d) pour chaque allèle prédéfini et ensemble de k-mères associés à l'allèle, déterminer le nombre d'occurrences de chaque k-mère dans ledit ensemble de séquences lues; e) filtrer le nombre déterminé d'occurrences de chaque k-mère; en remettant ledit nombre d'occurrences de chaque k-mère à 0 si: i) le nombre total d'occurrences est en dessous d'un seuil prédéfini, ii) le nombre total d'occurrences dans la direction avant est en dessous d'un seuil prédéfini, ou iii) le nombre total d'occurrences dans la direction arrière est inférieure à un seuil prédéfini; f) déterminer la présence ou l'absence de chaque allèle prédéfini dans les séquences lues sur la base du nombre filtré d'occurrences de chaque k-mère obtenu à l'étape e).
Also published as
Latest bibliographic data on file with the International Bureau