Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018161824) EXCEPTIONAL DATA DETECTION METHOD AND DEVICE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/161824 International Application No.: PCT/CN2018/077507
Publication Date: 13.09.2018 International Filing Date: 28.02.2018
IPC:
G06F 17/30 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
Applicants:
博彦科技股份有限公司 BEYONDSOFT(BEIJING)CO.LTD. [CN/CN]; 中国北京市 海淀区西北旺东路10号院东区7号楼博彦科技大厦 Beyondsoft Headquarters Bldg. 7,East Zone Courtyard #10, Xibeiwang East Road, Haidian District Beijing 100193, CN
Inventors:
李刚毅 LI, Gangyi; CN
赵小光 ZHAO, Xiaoguang; CN
Agent:
北京康信知识产权代理有限责任公司 KANGXIN PARTNERS, P. C.; 中国北京市 海淀区知春路甲48号盈都大厦A座16层 Floor 16, Tower A, Indo Building A48 Zhichun Road, Haidian District Beijing 100098, CN
Priority Data:
201710145015.010.03.2017CN
Title (EN) EXCEPTIONAL DATA DETECTION METHOD AND DEVICE
(FR) PROCÉDÉ ET DISPOSITIF DE DÉTECTION DE DONNÉES EXCEPTIONNELLES
(ZH) 异常数据检测方法和装置
Abstract:
(EN) The present invention discloses an exceptional data detection method and device wherein the method comprises: acquiring texts; extracting multiple data entries from the texts, wherein each of the multiple data entries consist of multiple attribute values and each of the attribute values correspond to a data attribute, and the attributes of each data entry are identical; performing merging on the attribute value of each data entry to obtain a new attribute value of each data entry, wherein a quantity of the new attribute value of each data entry is less than a quantity of the attribute value of each pre-merging data entry; and using the new attribute value of each data entry to perform machine learning so as to obtain a data model, wherein the data model is used for distinguishing if the data extracted from the text are exceptional data. The present invention can be used to solve the issue in the prior art caused by using large data dimensions for training, thus increasing training efficiency and accuracy of training results.
(FR) La présente invention concerne un procédé et un dispositif de détection de données exceptionnelles, le procédé consistant à : acquérir des textes; extraire de multiples entrées de données à partir des textes, chacune des multiples entrées de données étant constituée de multiples valeurs d'attribut et chacune des valeurs d'attribut correspondant à un attribut de données, et les attributs de chaque entrée de données sont identiques; effectuer une fusion sur la valeur d'attribut de chaque entrée de données pour obtenir une nouvelle valeur d'attribut de chaque entrée de données, une quantité de la nouvelle valeur d'attribut de chaque entrée de données étant inférieure à une quantité de la valeur d'attribut de chaque entrée de données de pré-fusion; et utiliser la nouvelle valeur d'attribut de chaque entrée de données pour effectuer un apprentissage machine de façon à obtenir un modèle de données, le modèle de données étant utilisé pour distinguer si les données extraites du texte sont des données exceptionnelles. La présente invention peut être utilisée pour résoudre le problème de l'état de la technique provoqué par l'utilisation de grandes dimensions de données pour l'apprentissage, augmentant ainsi l'efficacité d'entraînement et la précision des résultats d'apprentissage.
(ZH) 本发明公开了一种异常数据检测方法和装置。其中,该方法包括:获取文本;从所述文本中提取多条数据,其中,所述多条数据中的每一条数据均由多个属性值构成,每个属性值对应该数据的一个属性,所述每一条数据的属性均相同;对所述每一条数据的属性值进行汇合得到所述每一条数据的新属性值,其中,所述每一条数据的新属性值的个数小于汇合之前的所述每一条数据的属性值的个数;使用所述每一条数据的新属性值进行机器学习得到数据模型,其中,所述数据模型用于区分从文本中提取的数据是否为异常数据。通过本发明解决了现有技术中所存在的用于培训的数据维度大导致的问题,提高培训效率的同时提高了培训结果的准确度。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)