Traitement en cours

Veuillez attendre...

PATENTSCOPE sera indisponible durant quelques heures pour des raisons de maintenance le mardi 27.07.2021 à 12:00 PM CEST
Paramétrages

Paramétrages

Aller à Demande

1. WO2020155623 - PROCÉDÉ, SYSTÈME ET DISPOSITIF DE TRAITEMENT DE FILTRAGE D'ALIGNEMENT DE SÉQUENCE ET SUPPORT D'INFORMATIONS LISIBLE

Numéro de publication WO/2020/155623
Date de publication 06.08.2020
N° de la demande internationale PCT/CN2019/103720
Date du dépôt international 30.08.2019
CIB
G16B 30/00 2019.1
GPHYSIQUE
16TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES À DES DOMAINES D’APPLICATION SPÉCIFIQUES
BBIO-INFORMATIQUE, c. à d. TECHNOLOGIES DE L’INFORMATION ET DE LA COMMUNICATION SPÉCIALEMENT ADAPTÉES AU TRAITEMENT DES DONNÉES GÉNÉTIQUES OU PROTÉIQUES DANS LA BIOLOGIE MOLÉCULAIRE INFORMATIQUE
30TIC spécialement adaptées à l’analyse de séquences impliquant des nucléotides ou des aminoacides
CPC
G16B 30/00
GPHYSICS
16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
30ICT specially adapted for sequence analysis involving nucleotides or amino acids
Déposants
  • 郑州云海信息技术有限公司 ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY CO., LTD. [CN]/[CN]
Inventeurs
  • 赵健 ZHAO, Jian
  • 史宏志 SHI, Hongzhi
  • 崔星辰 CUI, Xingchen
  • 尹云峰 YIN, Yunfeng
Mandataires
  • 北京集佳知识产权代理有限公司 UNITALEN ATTORNEYS AT LAW
Données relatives à la priorité
201910098868.231.01.2019CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) SEQUENCE ALIGNMENT FILTERING PROCESSING METHOD, SYSTEM AND DEVICE, AND READABLE STORAGE MEDIUM
(FR) PROCÉDÉ, SYSTÈME ET DISPOSITIF DE TRAITEMENT DE FILTRAGE D'ALIGNEMENT DE SÉQUENCE ET SUPPORT D'INFORMATIONS LISIBLE
(ZH) 一种序列比对滤波处理方法、系统、装置及可读存储介质
Abrégé
(EN)
A sequence alignment filtering processing method, system and device, and a computer readable storage medium. The method comprises: performing partitioning processing on an absolute position of each seed appearing on a reference sequence to obtain a relative position of each seed after partitioning; dividing the reference sequence into a plurality of reference sequence sub-segments in advance, and establishing a mapping relationship between the relative position of each seed and the corresponding reference sequence sub-segment; determining, by using a feature identifier of each seed and the mapping relationship, a reference sub-sequence to which each seed belongs, and counting the number of occurrences of the seeds of each reference sub-sequence; filtering out, by using the number of occurrences of the seeds in each reference sub-sequence, reference sub-sequences that do not satisfy a preset condition to obtain a target reference sequence sub-segment; and restoring a true CAL by using a difference between the relative position and the absolute position of each seed in the target reference sequence sub-segment. According to the present application, invalid matching positions are filtered out as many as possible, workload of subsequent expansion is reduced, and work efficiency is improved.
(FR)
L'invention concerne un procédé, un système et un dispositif de traitement de filtrage d'alignement de séquence et un support d'informations lisible par ordinateur. Le procédé consiste : à réaliser un traitement de partitionnement sur une position absolue de chaque valeur de départ apparaissant sur une séquence de référence afin d'obtenir une position relative de chaque valeur de départ après le partitionnement ; à diviser la séquence de référence en une pluralité de sous-segments de séquence de référence à l'avance et à établir une relation de mappage entre la position relative de chaque valeur de départ et le sous-segment de séquence de référence correspondant ; à déterminer, au moyen d'un identifiant de caractéristique de chaque valeur de départ et de la relation de mappage, une sous-séquence de référence à laquelle appartient chaque valeur de départ, et à compter nombre d'occurrences des valeurs de départ de chaque sous-séquence de référence ; à filtrer, au moyen du nombre d'occurrences des valeurs de départ dans chaque sous-séquence de référence, des sous-séquences de référence qui ne satisfont pas une condition prédéfinie afin d'obtenir un sous-segment de séquence de référence cible ; et à restaurer une vraie CAL au moyen d'une différence entre la position relative et la position absolue de chaque valeur de départ dans le sous-segment de séquence de référence cible. Selon la présente invention, des positions d'appariement non valides sont filtrées autant que possible, la charge de travail d'une expansion ultérieure est réduite et l'efficacité de travail est améliorée.
(ZH)
一种序列比对滤波处理方法、系统、装置及计算机可读存储介质,包括:将每一个seed在参考序列上出现的绝对位置进行分块化处理,得到分块后的每个seed的相对位置;预先将参考序列划分为多个参考序列子片段,建立每个seed的相对位置与相应的参考序列子片段的映射关系;利用每个seed的特征标识和映射关系,确定出每个seed所属的参考子序列,并统计每个参考子序列的seed的出现次数;利用每个参考子序列中seed的出现次数,过滤掉不满足预设条件的参考子序列,得到目标参考序列子片段;利用目标参考序列子片段中每个seed的相对位置与绝对位置的差值,恢复出真正的CAL;本申请尽可能多地过滤掉无效的匹配位置,减少后续扩展的工作负载,提高了工作效率。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international