Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020117359 - SYSTÈME ET PROCÉDÉ POUR OBTENIR UNE HAUTE RÉSOLUTION DE DONNÉES GÉNÉTIQUES EN UTILISANT DES ENSEMBLES D'ENTRAÎNEMENT

Numéro de publication WO/2020/117359
Date de publication 11.06.2020
N° de la demande internationale PCT/US2019/053634
Date du dépôt international 27.09.2019
CIB
G16B 10/00 2019.01
GPHYSIQUE
16TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES À DES DOMAINES D’APPLICATION SPÉCIFIQUES
BBIO-INFORMATIQUE, c. à d. TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES AU TRAITEMENT DES DONNÉES GÉNÉTIQUES OU PROTÉIQUES DANS LA BIOLOGIE MOLÉCULAIRE INFORMATIQUE
10TIC spécialement adaptées à la bio-informatique évolutive, p. ex. construction ou analyse d’arbre phylogénétique
G16B 40/00 2019.01
GPHYSIQUE
16TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES À DES DOMAINES D’APPLICATION SPÉCIFIQUES
BBIO-INFORMATIQUE, c. à d. TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES AU TRAITEMENT DES DONNÉES GÉNÉTIQUES OU PROTÉIQUES DANS LA BIOLOGIE MOLÉCULAIRE INFORMATIQUE
40TIC spécialement adaptées aux biostatistiques; TIC spécialement adaptées à l’apprentissage automatique ou à l’exploration de données liées à la bio-informatique, p.ex. extraction de connaissances ou détection de motifs
G06K 9/62 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
62Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
CPC
G06K 9/62
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
G16B 10/00
GPHYSICS
16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
10ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
G16B 40/00
GPHYSICS
16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
40ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Déposants
  • HUANG, Yanmei [US]/[US]
  • FERNANDEZ ESCAPA, Isabel [ES]/[US]
  • LEMON, Katherine [US]/[US]
  • DEWHIRST, Floyd, E. [US]/[US]
Inventeurs
  • HUANG, Yanmei
  • FERNANDEZ ESCAPA, Isabel
  • LEMON, Katherine
  • DEWHIRST, Floyd, E.
Mandataires
  • RUSSELL, Hathaway, P.
Données relatives à la priorité
62/775,99706.12.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) SYSTEM AND METHOD FOR ACHIEVING HIGH GENE DATA RESOLUTION USING TRAINING SETS
(FR) SYSTÈME ET PROCÉDÉ POUR OBTENIR UNE HAUTE RÉSOLUTION DE DONNÉES GÉNÉTIQUES EN UTILISANT DES ENSEMBLES D'ENTRAÎNEMENT
Abrégé
(EN)
Systems, methods, and computer program products for generating an enhanced set of sequences for taxonomical classification are disclosed. In various embodiments, a plurality of reference sequences are received. Each of the plurality of reference sequences corresponds to a taxonomical classification. A label corresponding to at least one of the reference sequences is assigned to each of a plurality of supplemental sequences. Each of the plurality of supplemental sequences and each of the plurality of reference sequences are truncated to a region of interest to thereby generate a truncated set of sequences. Similarity is measured between pairs of truncated sequences in the truncated set of sequences to determine whether the similarity is above a predetermined threshold. An intermediate taxonomical label is assigned to the pair of truncated sequences in the truncated set of sequences when the similarity is above the predetermined threshold to thereby generate an enhanced set of sequences.
(FR)
L'invention concerne des systèmes, des procédés et des produits de programme informatique pour générer un ensemble amélioré de séquences destinées à la classification taxonomique. Dans divers modes de réalisation, une pluralité de séquences de référence sont reçues. Chacune de la pluralité de séquences de référence correspond à une classification taxonomique. Une étiquette correspondant à au moins l'une des séquences de référence est attribuée à chacune d'une pluralité de séquences supplémentaires. Chacune de la pluralité de séquences supplémentaires et chacune de la pluralité de séquences de référence sont tronquées à une région d'intérêt afin de générer ainsi un ensemble tronqué de séquences. Une similarité est mesurée entre des paires de séquences tronquées dans l'ensemble tronqué de séquences afin de déterminer si la similarité est supérieure à un seuil prédéterminé. Une étiquette taxonomique intermédiaire est attribuée à la paire de séquences tronquées dans l'ensemble tronqué de séquences lorsque la similarité est supérieure au seuil prédéterminé afin de générer ainsi un ensemble amélioré de séquences.
Dernières données bibliographiques dont dispose le Bureau international