Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/023978 International Application No.: PCT/CN2017/095612
Publication Date: 07.02.2019 International Filing Date: 02.08.2017
G06F 19/20 (2011.01)
Digital computing or data processing equipment or methods, specially adapted for specific applications
Bioinformatics, i.e. methods or systems for genetic or protein-related data processing in computational molecular biology
for hybridisation or gene expression, e.g. microarrays, sequencing by hybridisation, normalisation, profiling, noise correction models, expression ratio estimation, probe design or probe optimisation
深圳市瀚海基因生物科技有限公司 DIRECT GENOMICS CO., LTD [CN/CN]; 中国广东省深圳市 罗湖区莲塘街道国威路72号高新技术产业第一园区111栋一楼 1st Floor, 111 Building High-tech Industrial Park 1st Zone No. 72 Guowei Road, Liantang Street, Luohu District Shenzhen, Guangdong 518000, CN
徐伟彬 XU, Weibin; CN
金欢 JIN, Huan; CN
颜钦 YAN, Qin; CN
姜泽飞 JIANG, Zefei; CN
周志良 ZHOU, Zhiliang; CN
深圳鼎合诚知识产权代理有限公司 DHC IP ATTORNEYS; 中国广东省深圳 福田区金田路与福华路交汇处现代商务大厦2201 Suite 2201, Modern International Commercial Building, Cross of Fuhua Road and Jintian Road Futian District Shenzhen, Guangdong 518048, CN
Priority Data:
(ZH) 比对方法、装置及系统
(EN) An alignment method, device and system. The alignment method comprises: converting each read into a set of short fragments corresponding to the read to obtain multiple sets of short fragments; determining corresponding locations of the short segments in a reference library to obtain a first locating result, wherein the so-called reference library is a Hash table constructed based on a reference sequence, the reference library contains multiple entries, one entry in the reference library corresponds to a seed sequence, the seed sequence can match at least one sequence fragment on the reference sequence, and distance between two seed sequences corresponding to two adjacent entries of the reference library on the reference sequence is less than the length of the short fragment; removing the short fragment located at any one of the adjacent entries of the reference library from the first locating result to obtain a second locating result; and performing extension based on a common part of the short fragments from the same read in the second locating result to obtain an alignment result of the read. By means of the alignment method, the sequencing data can be processed and located efficiently and accurately.
(FR) L'invention concerne un procédé, un dispositif et un système d'alignement. Le procédé d'alignement consiste à : convertir chaque lecture en un ensemble de fragments courts correspondant à la lecture afin d'obtenir de multiples ensembles de fragments courts ; déterminer des emplacements correspondants des segments courts dans une bibliothèque de référence afin d'obtenir un premier résultat de localisation, la bibliothèque dite de référence étant une table de hachage construite sur la base d'une séquence de référence, la bibliothèque de référence contenant de multiples entrées, une entrée dans la bibliothèque de référence correspond à une séquence de germes, la séquence de germes peut correspondre à au moins un fragment de séquence sur la séquence de référence, et la distance entre deux séquences de germes correspondant à deux entrées adjacentes de la bibliothèque de référence sur la séquence de référence est inférieure à la longueur du fragment court ; supprimer le fragment court situé au niveau de l'une quelconque des entrées adjacentes de la bibliothèque de référence du premier résultat de localisation afin obtenir un deuxième résultat de localisation ; et réaliser une extension sur la base d'une partie commune des fragments courts issus de la même lecture dans le deuxième résultat de localisation afin d'obtenir un résultat d'alignement de la lecture. Le procédé d'alignement permet de traiter et de localiser les données de séquençage de manière efficace et précise.
(ZH) 一种比对方法、装置及系统,比对方法包括:将每条读段转化成与该读段对应的一组短片段,获得多组短片段;确定短片段在参考库的对应位置,以获得第一定位结果,所称的参考库为基于参考序列构建的哈希表,参考库包含多个条目,参考库的一个条目对应一条种子序列,种子序列能够与参考序列上的至少一段序列匹配,参考库的相邻两个条目对应的两条种子序列在参考序列上的距离小于短片段的长度;去除第一定位结果中定位到参考库相邻条目中的任一条目上的短片段,获得第二定位结果;基于第二定位结果中来自相同读段的短片段的公共部分进行延伸,以获得读段的比对结果。该比对方法能够对测序数据进行高效准确的处理及定位。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)