Processing

Please wait...

Settings

Settings

Goto Application

1. WO2019080860 - WEBPAGE REQUEST IDENTIFICATION

Publication Number WO/2019/080860
Publication Date 02.05.2019
International Application No. PCT/CN2018/111599
International Filing Date 24.10.2018
IPC
H04L 29/06 2006.1
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
29Arrangements, apparatus, circuits or systems, not covered by a single one of groups H04L1/-H04L27/136
02Communication control; Communication processing
06characterised by a protocol
H04L 12/24 2006.1
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
12Data switching networks
02Details
24Arrangements for maintenance or administration
CPC
H04L 41/145
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
41Arrangements for maintenance or administration or management of packet switching networks
14involving network analysis or design, e.g. simulation, network model or planning
145involving simulating, designing, planning or modelling of a network
H04L 63/1408
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
63Network architectures or network communication protocols for network security
14for detecting or protecting against malicious traffic
1408by monitoring network traffic
H04L 63/1416
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
63Network architectures or network communication protocols for network security
14for detecting or protecting against malicious traffic
1408by monitoring network traffic
1416Event detection, e.g. attack signature detection
H04L 63/1433
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
63Network architectures or network communication protocols for network security
14for detecting or protecting against malicious traffic
1433Vulnerability analysis
H04L 63/1466
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
63Network architectures or network communication protocols for network security
14for detecting or protecting against malicious traffic
1441Countermeasures against malicious traffic
1466Active attacks involving interception, injection, modification, spoofing of data unit addresses, e.g. hijacking, packet injection or TCP sequence number attacks
H04L 63/1483
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
63Network architectures or network communication protocols for network security
14for detecting or protecting against malicious traffic
1441Countermeasures against malicious traffic
1483service impersonation, e.g. phishing, pharming or web spoofing
Applicants
  • 新华三信息安全技术有限公司 NEW H3C SECURITY TECHNOLOGIES CO., LTD. [CN]/[CN]
Inventors
  • 贾若然 JIA, Ruoran
  • 顾成杰 GU, Chengjie
Agents
  • 北京柏杉松知识产权代理事务所(普通合伙) PATENTSINO IP FIRM
Priority Data
201711013266.X26.10.2017CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) WEBPAGE REQUEST IDENTIFICATION
(FR) IDENTIFICATION DE REQUÊTE DE PAGE WEB
(ZH) 网页请求识别
Abstract
(EN) A webpage request identification method and device. The method comprises: obtaining a plurality of sample webpage requests marked with tags, the tags comprising a tag used for indicating that the webpage request is a malicious webpage request or a tag used for indicating that the webpage request is a non-malicious webpage request; determining a structural feature of each sample webpage request; obtaining text words for each sample webpage request; calculating weight of each text word of each sample webpage request; determining a feature vector of each sample webpage request according to the structural feature of each sample webpage request and the weight of each text word thereof; on the basis of machine learning algorithms, training a webpage request identification model according to the feature vector and the tag of each sample webpage request; and when the webpage request to be identified is obtained, identifying the webpage request to be identified by means of the webpage request identification model, and determining whether the webpage request to be identified is a malicious webpage request. By applying the embodiments of the present application, the accuracy of the webpage request identification is improved.
(FR) L’invention concerne un procédé et un dispositif d’identification de requête de page web. Le procédé consiste à : obtenir une pluralité de requêtes de page web échantillons marquées avec des étiquettes, les étiquettes comprenant une étiquette utilisée pour indiquer que la requête de page web est une requête de page web malveillante ou une étiquette utilisée pour indiquer que la requête de page web est une requête de page web non malveillante ; déterminer une caractéristique structurale de chaque requête de page web échantillon ; obtenir des mots de texte pour chaque requête de page web échantillon ; calculer un poids de chaque mot de texte de chaque requête de page web échantillon ; déterminer un vecteur de caractéristiques de chaque requête de page web échantillon en fonction de la caractéristique structurale de chaque requête de page web échantillon et du poids de chaque mot de texte de chaque requête de page web échantillon ; sur la base d'algorithmes d'apprentissage automatique, entraîner un modèle d'identification de requête de page web selon le vecteur de caractéristiques et l'étiquette de chaque requête de page web échantillon ; et lorsque la requête de page web à identifier est obtenue, identifier la requête de page web à identifier au moyen du modèle d'identification de requête de page web, et déterminer si la requête de page web à identifier est une requête de page web malveillante. L'application des modes de réalisation de la présente invention permet d'améliorer la précision de l'identification de requête de page web.
(ZH) 一种网页请求识别方法及装置,方法包括:获取多个标记有标签的样本网页请求,标签包括用于指示网页请求为恶意网页请求的标签或用于指示网页请求为非恶意网页请求的标签;确定每一样本网页请求的结构特征,获得对每一样本网页请求的文本词语,计算每一样本网页请求的每一文本词语的权重,根据每一样本网页请求的结构特征和每一文本词语的权重,确定每一样本网页请求的特征向量,基于机器学习算法,根据每一样本网页请求的特征向量和标签训练网页请求识别模型;当获取到待识别网页请求时,利用网页请求识别模型识别待识别网页请求,确定待识别网页请求是否为恶意网页请求。应用本申请实施例,提高了网页请求识别的准确率。
Related patent documents
Latest bibliographic data on file with the International Bureau