WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2000026819) METHODS AND APPARATUS FOR PERFORMING PATTERN DICTIONARY FORMATION FOR USE IN SEQUENCE HOMOLOGY DETECTION
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2000/026819    International Application No.:    PCT/US1999/025367
Publication Date: 11.05.2000 International Filing Date: 29.10.1999
IPC:
G06F 17/30 (2006.01), G06K 9/62 (2006.01)
Applicants: INTERNATIONAL BUSINESS MACHINES CORPORATION [US/US]; New Orchard Road Armonk, NY 10504 (US) (For All Designated States Except US).
FLORATOS, Aris [GR/US]; (US) (For US Only).
RIGOUTSOS, Isidore [GR/US]; (US) (For US Only)
Inventors: FLORATOS, Aris; (US).
RIGOUTSOS, Isidore; (US)
Agent: LEWIS, William, E.; Ryan & Mason, L.L.P. 90 Forest Avenue Locust Valley, NY 11560 (US)
Priority Data:
60/106,295 30.10.1998 US
Title (EN) METHODS AND APPARATUS FOR PERFORMING PATTERN DICTIONARY FORMATION FOR USE IN SEQUENCE HOMOLOGY DETECTION
(FR) PROCEDES ET APPAREIL PERMETTANT LA FABRICATION D'UN DICTIONNAIRE DE MODELES DESTINE A LA DETECTION D'HOMOLOGIES DE SEQUENCES
Abstract: front page image
(EN)In a dictionary formation aspect of the invention, a computer-based method of processing a plurality of sequences in a database comprises the following steps. First, the method includes evaluating each of the plurality of sequences including characters which form each sequence. Then, at least one pattern of characters is generated representing at least a subset of the sequences in the database. The pattern has a statistical significance associated therewith, the statistical significance of the pattern being determined by a value representing a minimum number of sequences that the pattern supports in the database.
(FR)La présente invention se rapporte à un procédé informatique de traitement d'une pluralité de séquences dans une base de données. Ce procédé consiste premièrement à évaluer chacune des séquences d'un ensemble de séquences, chacune de ces séquences étant composée de caractères; deuxièmement à générer au moins un modèle de caractères représentant au moins un sous-ensemble des séquences de la base de données. Ce modèle est associé à une signification statistique qui est déterminée au moyen d'une valeur représentant un nombre minimum de séquences que le modèle prend en charge dans la base de données.
Designated States: CA, CN, JP, US.
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE).
Publication Language: English (EN)
Filing Language: English (EN)