WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2017143919) PROCÉDÉ ET APPAREIL D'ÉTABLISSEMENT DE MODÈLE D'IDENTIFICATION DE DONNÉES
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2017/143919    N° de la demande internationale :    PCT/CN2017/073444
Date de publication : 31.08.2017 Date de dépôt international : 14.02.2017
CIB :
G06K 9/62 (2006.01), G06N 3/08 (2006.01), G06Q 30/06 (2012.01)
Déposants : ALIBABA GROUP HOLDING LIMITED [--/CN]; Fourth Floor, One Capital Place, P.O. Box 847, George Town, Grand Cayman (KY)
Inventeurs : JIANG, Xiaoyan; (CN).
YANG, Xu; (CN).
DAI, Bin; (CN).
CHU, Wei; (CN)
Mandataire : BEIJING SANYOU INTELLECTUAL PROPERTY AGENCY LTD.; 16th Fl.,Block A,Corporate Square,No.35 Jinrong Street Beijing 100033 (CN)
Données relatives à la priorité :
201610110817.3 26.02.2016 CN
Titre (EN) METHOD AND APPARATUS FOR ESTABLISHING DATA IDENTIFICATION MODEL
(FR) PROCÉDÉ ET APPAREIL D'ÉTABLISSEMENT DE MODÈLE D'IDENTIFICATION DE DONNÉES
(ZH) 一种建立数据识别模型的方法及装置
Abrégé : front page image
(EN)A method and apparatus for establishing a data identification model, for use in establishing a data identification model according to training samples comprising positive and negative samples. The method comprises: performing feature engineering preprocessing on training samples (S1); performing feature screening on the preprocessed training samples, performing logistic regression training by using the training samples subjected to the feature screening, and identifying positive samples using a first model obtained by the training (S2); proportionally sampling the preprocessed training samples, and performing DNN training by using a first training sample set obtained by the sampling, to obtain a second model (S3); selecting, according to the result of performing DNN training by using the first training sample set and the result of identifying the positive samples using the first model, positive samples having identification results after being identified using the first model, to obtain a second training sample set (S4); and performing DNN training by using the first training sample set and the second training sample set to obtain a final data identification model (S5). The apparatus comprises a first training module, a sampling module, a selection module, and a final model training module. The present invention improves the stability of data identification models.
(FR)L'invention concerne un procédé et un appareil pour établir un modèle d'identification de données, destinés à être utilisés dans l'établissement d'un modèle d'identification de données selon des échantillons d'apprentissage comprenant des échantillons positifs et négatifs. Le procédé consiste : à effectuer un prétraitement d'ingénierie de caractéristiques sur des échantillons d'apprentissage (S1) ; à effectuer un criblage de caractéristiques sur les échantillons d'apprentissage prétraités, à effectuer un apprentissage de régression logistique à l'aide d'échantillons d'apprentissage soumis au criblage de caractéristiques, et à identifier des échantillons positifs à l'aide d'un premier modèle obtenu par l'apprentissage (S2) ; à échantillonner de manière proportionnelle les échantillons d'apprentissage prétraités, et à effectuer un apprentissage de DNN à l'aide d'un premier ensemble d'échantillons d'apprentissage obtenu par l'échantillonnage, pour obtenir un second modèle (S3) ; à sélectionner, selon le résultat de la réalisation de l'apprentissage de DNN en utilisant le premier ensemble d'échantillons d'apprentissage et le résultat de l'identification des échantillons positifs à l'aide du premier modèle, des échantillons positifs ayant des résultats d'identification après avoir été identifiés à l'aide du premier modèle, pour obtenir un second ensemble d'échantillons d'apprentissage (S4) ; et à effectuer un apprentissage de DNN à l'aide du premier ensemble d'échantillons d'apprentissage et du second ensemble d'échantillons d'apprentissage pour obtenir un modèle d'identification de données final (S5). L'appareil comprend un premier module d'apprentissage, un module d'échantillonnage, un module de sélection et un module d'apprentissage de modèle final. La présente invention améliore la stabilité des modèles d'identification de données.
(ZH)一种建立数据识别模型的方法及装置,用于根据包括正、负样本的训练样本建立数据识别模型,该方法包括:对训练样本进行特征工程预处理(S1);对预处理后的训练样本进行特征筛选,采用特征筛选后的训练样本进行逻辑回归训练,采用训练得到的第一模型对正样本进行识别(S2);对预处理后的训练样本按比例采样,采用采样后得到的第一训练样本集进行DNN训练,得到第二模型(S3);根据采用第一训练样本集进行DNN训练的结果与采用第一模型对正样本进行识别的结果,从第一模型识别后具有识别结果的正样本中选择出第二训练样本集(S4);采用第一训练样本集和第二训练样本集进行DNN训练得到最终的数据识别模型(S5)。装置包括第一训练模块、采样模块、选择模块和最终模型训练模块。提高了数据识别模型的稳定性。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)