Processing

Please wait...

Settings

Settings

1. WO2007062164 - SYSTEM AND METHOD FOR CLEANING NOISY GENETIC DATA AND USING DATA TO MAKE PREDICTIONS

Publication Number WO/2007/062164
Publication Date 31.05.2007
International Application No. PCT/US2006/045281
International Filing Date 22.11.2006
IPC
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
19
Digital computing or data processing equipment or methods, specially adapted for specific applications
10
Bioinformatics, i.e. methods or systems for genetic or protein-related data processing in computational molecular biology
18
for functional genomics or proteomics, e.g. genotype-phenotype associations, linkage disequilibrium, population genetics, binding site identification, mutagenesis, genotyping or genome annotation, protein-protein interactions or protein-nucleic acid interactions
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
19
Digital computing or data processing equipment or methods, specially adapted for specific applications
10
Bioinformatics, i.e. methods or systems for genetic or protein-related data processing in computational molecular biology
22
for sequence comparison involving nucleotides or amino acids, e.g. homology search, motif or SNP [Single-Nucleotide Polymorphism] discovery or sequence alignment
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
19
Digital computing or data processing equipment or methods, specially adapted for specific applications
10
Bioinformatics, i.e. methods or systems for genetic or protein-related data processing in computational molecular biology
24
for machine learning, data mining or biostatistics, e.g. pattern finding, knowledge discovery, rule extraction, correlation, clustering or classification
G06F 19/18 (2011.01)
G06F 19/22 (2011.01)
G06F 19/24 (2011.01)
CPC
C12Q 1/6809
C12Q 1/6869
C12Q 1/6874
G16B 20/00
G16B 30/00
G16B 40/00
Applicants
  • GENE SECURITY NETWORK LLC [US/US]; 80 HAYFIELDS ROAD Portola Valley, CA 94028, US (AllExceptUS)
  • RABINOWITZ, Matthew [US/US]; US (UsOnly)
  • BANJEVIC, Milena [CA/US]; US (UsOnly)
  • DEMKO, Zachary, Paul [US/US]; US (UsOnly)
  • JOHNSON, David, Scott [US/US]; US (UsOnly)
Inventors
  • RABINOWITZ, Matthew; US
  • BANJEVIC, Milena; US
  • DEMKO, Zachary, Paul; US
  • JOHNSON, David, Scott; US
Agents
  • ELRIFI, Ivor, R.; MINTZ, LEVIN, COHN, FERRIS, GLOVSKY & POPEO PC ONE FINANCIAL CENTER Boston, MA 02111, US
Priority Data
11/496,98231.07.2006US
60/739,88226.11.2005US
60/742,30506.12.2005US
60/754,39629.12.2005US
60/774,97621.02.2006US
60/789,50604.04.2006US
60/817,74130.06.2006US
60/846,61022.09.2006US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SYSTEM AND METHOD FOR CLEANING NOISY GENETIC DATA AND USING DATA TO MAKE PREDICTIONS
(FR) SYSTEME ET PROCEDE DE NETTOYAGE DE DONNEES GENETIQUES BRUITEES, ET UTILISATION DE DONNEES GENETIQUES, PHENOTYPIQUES ET CLINIQUES POUR FAIRE DES PREVISIONS
Abstract
(EN)
A system and method for determining the genetic data for one or a small set of cells, or from fragmentary DNA, where a limited quantity of genetic data is available, and also for predicting likely phenotypic outcomes using mathematical models and given genetic, phenotypic and/or clinical data of an individual, and also relevant aggregated medical data consisting of genotypic, phenotypic, and/or clinical data from germane patient subpopulations. Genetic data for the target individual is acquired and amplified using known methods, and poorly measured base pairs, missing alleles and missing regions are reconstructed using expected similarities between the target genome and the genome of genetically related subjects.
(FR)
L'invention concerne un système et un procédé permettant de déterminer les données génétiques d'une cellules ou d'un ensemble restreint de cellules, ou à partir d'ADN fragmentaire, où l'on dispose d'une quantité limitée de données génétiques, mais aussi de prédire des résultats phénotypiques probables à l'aide de modèles mathématiques et de données génétiques, phénotypiques et/ou cliniques d'un patient, ainsi que de données médicales groupées pertinentes composées de données génotypiques, phénotypiques, et/ou cliniques provenant de sous-populations de patients apparentées. Les données génétiques de l'individu cible sont acquises et amplifiées par des procédés courants, et des paires de base grossièrement mesurées, des allèles manquants et des zones manquantes sont reconstitués à l'aide de similitudes escomptées entre le génome cible et celui de sujets génétiquement apparentés. Dans un mode de réalisation, des données génétiques incomplètes d'une cellule embryonnaire sont reconstituées au moyen de données génétiques plus complètes provenant d'un plus grand échantillon de cellules diploïdes d'un ou des deux parents, avec ou sans données génétiques de cellules haploïdes d'un ou des deux parents, et/ou de données génétiques prises chez d'autres individus apparentés. Dans un autre mode de réalisation, des données génétiques incomplètes provenant d'un foetus sont obtenues de cellules foetales, ou d'ADN foetal acellulaire isolé à partir du sang de la mère, et les données génétiques incomplètes sont reconstituées au moyen des données génétiques plus complètes à partir d'un plus grand échantillon de cellules diploïdes d'un ou des deux parents, avec ou sans données génétiques de cellules haploïdes d'un ou des deux parents, et/ou de données génétiques prélevées chez d'autres individus apparentés. Dans un autre mode de réalisation, les données génétiques peuvent être reconstituées aux fins de la production de prévisions phénotypiques. Dans un autre mode de réalisation, on peut utiliser les données génétiques pour détecter des aneuploïdes et une disomie uniparentale. Dans un autre mode de réalisation, on peut faire des prévisions phénotypiques au moyen de modèles fondés sur des tableaux de contingence de données génétiques que l'on peut reconstituer à partir de données disponibles dans des bases de données génomiques. Dans un autre mode de réalisation enfin, on crée plusieurs modèles que l'on soumet à l'essai au moyen d'un ensemble de données pour essai, la prévision étant effectuée à l'aide du modèle identifié comme étant le plus précis.
Latest bibliographic data on file with the International Bureau