WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018039983) DISPOSITIF ET PROCÉDÉ DE TRAITEMENT DE DONNÉES DE SEQUENCE BIOLOGIQUE
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/039983 N° de la demande internationale : PCT/CN2016/097559
Date de publication : 08.03.2018 Date de dépôt international : 31.08.2016
CIB :
G06F 19/00 (2011.01)
Déposants : HUAWEI TECHNOLOGIES CO., LTD.[CN/CN]; Huawei Administration Building Bantian, Longgang District Shenzhen, Guangdong 518129, CN
Inventeurs : LIU, Zhe; CN
ZHANG, Jun; CN
Mandataire : SCIHEAD IP LAW FIRM; Room 1508, Huihua Commercial & Trade Building No. 80, XianLie Zhong Road, Yuexiu District Guangzhou, Guangdong 510070, CN
Données relatives à la priorité :
Titre (EN) BIOLOGICAL SEQUENCE DATA PROCESSING METHOD AND DEVICE
(FR) DISPOSITIF ET PROCÉDÉ DE TRAITEMENT DE DONNÉES DE SEQUENCE BIOLOGIQUE
(ZH) 一种生物序列数据的处理方法及装置
Abrégé : front page image
(EN) A biological sequence data processing method comprises: obtaining characteristic information of each of all bases in a biological sequence fastq file (S501); selecting a target base from all the bases according to the characteristic information of each base and a preset rule, and generating a base patch file by using the characteristic information of the target base (S502); performing lossless compression on the biological sequence fastq file to obtain a compressed fastq file, and performing lossless compression on the base patch file to obtain a compressed patch file (S503); respectively decompressing the compressed patch file and the compressed fastq file (S504); checking whether characteristic information of the target base in the compressed patch file is consistent with the characteristic information of the target base in the compressed fastq file (S505); and if inconsistent, modifying the characteristic information of the target base in the decompressed compressed fastq file into the characteristic information of the target base in the decompressed compressed patch file (S506). By means of the method, the site precision in a fastq file after compression is improved in a case in which a compression ratio is ensured.
(FR) L'invention concerne un procédé de traitement de données de séquence biologique consiste à : obtenir des informations caractéristiques de chacune de toutes les bases dans un fichier fastq de séquence biologique (S501); sélectionner une base cible parmi toutes les bases en fonction des informations caractéristiques de chaque base et d'une règle prédéfinie, et générer un fichier de timbre de base à l'aide des informations caractéristiques de la base cible (S502); réaliser une compression sans perte sur le fichier fastq de séquence biologique pour obtenir un fichier fastq compressé, et la réalisation d'une compression sans perte sur le fichier de correctif de base pour obtenir un fichier correctif compressé (S503); décompresser respectivement le fichier correctif compressé et le fichier fastq compressé (S504); vérifier si des informations caractéristiques de la base cible dans le fichier de correctif compressé sont cohérentes avec les informations caractéristiques de la base cible dans le fichier fastq compressé (S505); et si incohérent, modifier les informations caractéristiques de la base cible dans le fichier fastq compressé décompressé en informations caractéristiques de la base cible dans le fichier de correctif compressé décompressé (S506) Grâce au procédé, la précision de site dans un fichier fastq après compression est améliorée dans un cas où un taux de compression est garanti.
(ZH) 一种生物序列数据的处理方法,包括:获取生物序列fastq文件中所有碱基中每个碱基的特征信息(S501);根据所述每个碱基的特征信息,按照预设规则从所述所有碱基中选取出目标碱基,并将所述目标碱基的特征信息生成碱基补丁文件(S502);对所述生物序列fastq文件进行无损压缩得到压缩fastq文件,对所述碱基补丁文件进行无损压缩得到压缩补丁文件(S503);分别对所述压缩补丁文件和所述压缩fastq文件进行解压(S504);校对解压后的所述压缩补丁文件中所述目标碱基的特征信息是否与解压后的所述压缩fastq文件中所述目标碱基的特征信息一致(S505);若不一致,将解压后的所述压缩fastq文件中所述目标碱基的特征信息修正为解压后的所述压缩补丁文件中所述目标碱基的特征信息(S506)。该方法在保障压缩比的情况下,提高fastq文件压缩后的位点精度。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)