Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019041333) PROCÉDÉ, APPAREIL, DISPOSITIF ET SUPPORT D'INFORMATIONS POUR LA PRÉDICTION DE SITES DE LIAISON DE PROTÉINES
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/041333 N° de la demande internationale : PCT/CN2017/100314
Date de publication : 07.03.2019 Date de dépôt international : 04.09.2017
CIB :
G06F 19/18 (2011.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
19
Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des applications spécifiques
10
Bio-informatique, c. à d. procédés ou systèmes pour le traitement de données génétiques ou se rapportant aux protéines en biologie moléculaire informatique
18
pour la génomique ou la protéomique fonctionnelle, p.ex. associations génotype-phénotype, déséquilibre de liaison, mutagénèse, génotypage ou annotation génomique, interactions protéines-protéines ou interactions protéines-acides nucléiques
Déposants :
深圳大学 SHENZHEN UNIVERSITY [CN/CN]; 中国广东省深圳市 南山区南海大道3688号 NO. 3688, Nanhai Ave, Nanshan Shenzhen, Guangdong 518060, CN
哈尔滨工业大学深圳研究生院 HARBIN INSTITUTE OF TECHNOLOGY SHENZHEN GRADUATE SCHOOL [CN/CN]; 中国广东省深圳 南山区深圳大学城哈工大校区 HIT Campus, the University Town of Shenzhen, Nanshan District Shenzhen, Guangdong 518055, CN
Inventeurs :
张勇 ZHANG, Yong; CN
何威 HE, Wei; CN
徐勇 XU, Yong; CN
赵东宁 ZHAO, Dongning; CN
Mandataire :
深圳青年人专利商标代理有限公司 SHENZHEN YOUTH PATENT AND TRADEMARK AGENCY LTD.; 中国广东省深圳市 罗湖区深南东路5045号深业中心大厦2502-2503 Room 2502-2503, Shenye Center Building No. 5045, Shennan East Road, Luohu Shenzhen, Guangdong 518010, CN
Données relatives à la priorité :
201710770933.231.08.2017CN
Titre (EN) METHOD, APPARATUS, DEVICE AND STORAGE MEDIUM FOR PREDICTING PROTEIN BINDING SITES
(FR) PROCÉDÉ, APPAREIL, DISPOSITIF ET SUPPORT D'INFORMATIONS POUR LA PRÉDICTION DE SITES DE LIAISON DE PROTÉINES
(ZH) 蛋白质结合位点的预测方法、装置、设备及存储介质
Abrégé :
(EN) Disclosed are a method, apparatus, device and storage medium for predicting protein binding sites, wherein same are suitable for the biology information technology field. The method comprises: receiving a protein sequence to be predicted, and using a preset sliding window and sliding step size to divide the protein sequence, so as to obtain a plurality of amino acid subsequences (S101); constructing a term vector of the protein sequence according to the amino acid subsequences, extracting the document feature from a term element, and constructing a document feature vector of the protein sequence according to the extracted document feature (S102); extracting the biological feature of protein chains from the amino acid subsequences, and constructing a biological feature vector of the protein sequence according to the extracted biological feature (S103); and using a preset amino acid residue classification model to classify amino acid subsequences represented by the document feature vector and biological feature vector in order to obtain the amino acid residue type of the protein sequence (S104), and thereby improving the prediction accuracy and universality of protein binding sites.
(FR) L'invention concerne un procédé, un appareil, un dispositif et un support d'informations pour la prédiction de sites de liaison de protéines, et s'applique au domaine technologique des informations biologiques. Le procédé comprend les étapes qui consistent : à recevoir une séquence de protéines à prédire, et à utiliser une fenêtre glissante prédéfinie ainsi qu'une taille de pas de glissement prédéfinie pour diviser la séquence de protéines, de façon à obtenir une pluralité de sous-séquences d'acides aminés (S101) ; à construire un vecteur de termes de la séquence de protéines selon les sous-séquences d'acides aminés, à extraire d'un élément de terme une caractéristique de document, et à construire un vecteur de caractéristique de document de la séquence de protéines selon la caractéristique de document extraite (S102) ; à extraire des sous-séquences d'acides aminés une caractéristique biologique de chaînes protéiques, et à construire un vecteur de caractéristique biologique de la séquence de protéines selon la caractéristique biologique extraite (S103) ; et à utiliser un modèle de classification de résidus d'acides aminés prédéfini pour classer des sous-séquences d'acides aminés représentées par le vecteur de caractéristique de document et le vecteur de caractéristique biologique afin d'obtenir le type de résidus d'acides aminés de la séquence de protéines (S104), ce qui permet d'améliorer la précision de prédiction et l'universalité des sites de liaison de protéines.
(ZH) 一种蛋白质结合位点的预测方法、装置、设备及存储介质,适用于生物信息技术领域,该方法包括:接收待预测的蛋白质序列,使用预设的滑动窗口和滑动步长对蛋白质序列进行序列划分,得到多个氨基酸子序列(S101),根据这些氨基酸子序列构建蛋白质序列的词向量,对词元素进行文档特征提取,根据提取的文档特征构建蛋白质序列的文档特征向量(S102),对这些氨基酸子序列进行蛋白质链生物学特征提取,根据提取的生物学特征构建蛋白质序列的生物学特征向量(S103),使用预设的氨基酸残基分类模型对使用文档特征向量和生物学特征向量表示的氨基酸子序列进行分类,得到蛋白质序列的氨基酸残基类型(S104),从而提高了蛋白质结合位点预测的准确性和泛用性。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)