処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020240718 - 抽出装置、抽出方法及び抽出プログラム

公開番号 WO/2020/240718
公開日 03.12.2020
国際出願番号 PCT/JP2019/021166
国際出願日 28.05.2019
IPC
G06F 21/55 2013.1
G物理学
06計算;計数
F電気的デジタルデータ処理
21不正行為から計算機,その部品,プログラムまたはデータを保護するためのセキュリティ装置
50プラットフォーム,(例.プロセッサ,ファームウェアまたはOS)の完全性を維持するために、ユーザー,プログラムまたはデバイスを監視するもの
55ローカルへの侵入を検知または対抗策を実行するもの
CPC
G06F 21/55
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
21Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
55Detecting local intrusion or implementing counter-measures
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 小出 駿 KOIDE, Takashi
  • 千葉 大紀 CHIBA, Daiki
代理人
  • 特許業務法人酒井国際特許事務所 SAKAI INTERNATIONAL PATENT OFFICE
優先権情報
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) EXTRACTION DEVICE, EXTRACTION METHOD, AND EXTRACTION PROGRAM
(FR) DISPOSITIF D'EXTRACTION, PROCÉDÉ D'EXTRACTION, ET PROGRAMME D'EXTRACTION
(JA) 抽出装置、抽出方法及び抽出プログラム
要約
(EN) An extraction device (10) includes: an input unit (11) that receives the input of information of a plurality of web pages, including a HyperText Markup Language (HTML) element for which it is known that a browser operation will cause one to land on a malicious web page, and an HTML element for which it is known that a browser operation will cause one to land on a harmless web page; a cluster determination unit (12) that classifies the plurality of web pages for which input was received into clusters; an intra-element character string extraction unit (13) that extracts, from the web pages of the classified clusters, an HTML element which lands on a malicious web page and an HTML element which lands on a harmless web page, and extracts a first character string contained in the extracted HTML elements; and a keyword extraction unit (14) that extracts from the first character string, as a keyword, a second character string characterizing the HTML element which lands on a malicious web page.
(FR) L’invention concerne un dispositif d'extraction (10) qui comprend : une unité d'entrée (11) qui reçoit l'entrée d'informations d'une pluralité de pages web, comprenant un élément de langage de balisage hypertexte (HTML) pour lequel il est connu qu'une opération de navigateur amènerait à atterrir sur une page web malveillante, et un élément HTML pour lequel il est connu qu'une opération de navigateur amènerait à atterrir sur une page web inoffensive ; une unité de détermination de grappe (12) qui classifie la pluralité de pages web pour laquelle une entrée a été reçue en grappes ; une unité d'extraction de chaîne de caractères intra-élément (13) qui extrait, à partir des pages web des grappes classées, un élément HTML qui atterrit sur une page web malveillante et un élément HTML qui atterrit sur une page web inoffensive, et extrait une première chaîne de caractères contenue dans les éléments HTML extraits ; et une unité d'extraction de mots-clés (14) qui extrait de la première chaîne de caractères, en tant que mot-clé, une seconde chaîne de caractères caractérisant l'élément HTML qui atterrit sur une page web malveillante.
(JA) 抽出装置(10)は、ブラウザ操作によって悪性なWebページに到達することが既知のHTML(HyperText Markup Language)のエレメントと、ブラウザ操作によって良性なWebページに到達することが既知のHTMLのエレメントと、を含む複数のWebページの情報の入力を受け付ける入力部(11)と、入力が受け付けられた複数のWebページをクラスタごとに分類するクラスタ判定部(12)と、分類された各クラスタのWebページから、悪性なWebページに到達するHTMLのエレメントと良性なWebページに到達するHTMLのエレメントとを抽出し、抽出したHTMLのエレメントに含まれる第1の文字列を抽出するエレメント内文字列抽出部(13)と、第1の文字列から、悪性なWebページに到達するHTMLのエレメントを特徴づける第2の文字列を、キーワードとして抽出するキーワード抽出部(14)と、を有する。
Related patent documents
JP2021521639This application is not viewable in PATENTSCOPE because the national phase entry has not been published yet or the national entry is issued from a country that does not share data with WIPO or there is a formatting issue or an unavailability of the application.
国際事務局に記録されている最新の書誌情報