Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020062690 - METHOD AND APPARATUS FOR ILLEGAL USER IDENTIFICATION BASED ON BIG DATA ANALYSIS, AND ELECTRONIC DEVICE

Publication Number WO/2020/062690
Publication Date 02.04.2020
International Application No. PCT/CN2018/125248
International Filing Date 29.12.2018
IPC
G06F 16/35 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
CPC
G06F 21/31
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
21Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
30Authentication, i.e. establishing the identity or authorisation of security principals
31User authentication
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 孙家棣 SUN, Jiadi
  • 马宁 MA, Ning
Agents
  • 深圳市隆天联鼎知识产权代理有限公司 SHENZHEN LUNGTIN LIANDING INTELLECTUAL PROPERTY AGENT LTD.
Priority Data
201811120248.625.09.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) METHOD AND APPARATUS FOR ILLEGAL USER IDENTIFICATION BASED ON BIG DATA ANALYSIS, AND ELECTRONIC DEVICE
(FR) PROCÉDÉ ET APPAREIL PERMETTANT L'IDENTIFICATION D'UN UTILISATEUR ILLÉGAL SUR LA BASE D'UNE ANALYSE DE MÉGADONNÉES, ET DISPOSITIF ÉLECTRONIQUE
(ZH) 基于大数据分析的非法用户识别方法及装置、电子设备
Abstract
(EN)
A method and an apparatus for illegal user identification based on big data analysis, an electronic device, and a computer readable storage medium, relating to the technical field of big data. The method comprises: a set of users to be identified and valid feature data of a set of legal users are acquired (S310); the valid feature data of the set of legal users is clustered, and the number of clusters is determined (S330); the set of users to be identified and the valid feature data of the set of legal users are clustered according to said number of clusters to obtain a plurality of clusters (S350); abnormal clusters are filtered out from the plurality of clusters, the abnormal clusters being clusters among the plurality of clusters in which the number of legal users is less than a preset threshold, and users from the set of users to be identified that were clustered into abnormal clusters are confirmed to be illegal users (S370). Using clustering, falsely registered users can be batch-identified, improving identification efficiency, and because behavioral characteristic matching is no longer used to identify falsely registered users, identification accuracy is improved.
(FR)
L'invention concerne un procédé et un appareil permettant l'identification d'un utilisateur illégal sur la base d'une analyse de mégadonnées, un dispositif électronique et un support d'informations lisible par ordinateur, se rapportant au domaine technique des mégadonnées. Le procédé comprend les étapes suivantes : un ensemble d'utilisateurs devant être identifiés et des données de caractéristiques valides d'un ensemble d'utilisateurs légaux sont acquis (S310) ; les données de caractéristiques valides de l'ensemble d'utilisateurs légaux sont regroupées, et le nombre de groupements est déterminé (S330) ; l'ensemble d'utilisateurs devant être identifiés et les données de caractéristiques valides de l'ensemble d'utilisateurs légaux sont groupés en fonction dudit nombre de groupements pour obtenir une pluralité de groupements (S350) ; des groupements anormaux sont filtrés et éliminés de la pluralité de groupements, les groupements anormaux étant des groupements parmi la pluralité de groupements dans lesquels le nombre d'utilisateurs légaux est inférieur à un seuil prédéfini, et des utilisateurs de l'ensemble d'utilisateurs devant être identifiés qui ont été regroupés en groupements anormaux sont confirmés comme étant des utilisateurs illégaux (S370). En utilisant le regroupement, des utilisateurs enregistrés de manière frauduleuse peuvent être identifiés par lots, améliorant ainsi l'efficacité d'identification, et puisque la correspondance de caractéristiques comportementales n'est plus utilisée pour identifier des utilisateurs enregistrés de manière frauduleuse, la précision d'identification est améliorée.
(ZH)
一种基于大数据分析的非法用户识别方法及装置、电子设备、计算机可读存储介质,涉及大数据技术领域,所述方法包括:获取待识别用户集以及合法用户集的有效特征数据(S310);将所述合法用户集的有效特征数据进行聚类,确定聚类簇数(S330);按照所述聚类簇数对所述待识别用户集和合法用户集的有效特征数据进行聚类,得到多个聚类簇(S350);从所述多个聚类簇中筛选出异常簇,所述异常簇为所述多个聚类簇中合法用户数量小于预设阈值的聚类簇,确认所述待识别用户集中,聚类至所述异常簇的用户为非法用户(S370)。采用聚类的方式可以批量识别虚假注册的用户,提高识别效率,由于不再采用行为特征匹配的方式进行虚假注册用户的识别,提高了识别准确性。
Also published as
Latest bibliographic data on file with the International Bureau