(EN) A classification device (1) comprises a pseudo-teacher extraction unit (103), a learning unit (104), and a document classification unit (203). The pseudo-teacher extraction unit (103) creates pseudo-teacher data from threat documents that include descriptions relating to cyber threats, on the basis of a rule for creating pseudo-teacher data. The learning unit (104) learns a noise model and a classification model in parallel using the relationship between these models on the basis of the threat documents and the pseudo-teacher data created by the pseudo-teacher extraction unit (103). The document classification unit (203) classifies an input threat document to be classified, using the classification model generated from the learning by the learning unit (104).
(FR) L'invention concerne un dispositif de classification (1) comprenant une unité d'extraction de pseudo-enseignement (103), une unité d’apprentissage (104) et une unité de classification de documents (203). L'unité d'extraction de pseudo-enseignement (103) crée des données de pseudo-enseignement à partir de documents de menaces qui comprennent des descriptions relatives à des cybermenaces, sur la base d'une règle pour créer des données de pseudo-enseignement. L'unité d'apprentissage (104) apprend un modèle de bruit et un modèle de classification en parallèle à l'aide de la relation entre ces modèles sur la base des documents de menaces et des données de pseudo-enseignement créées par l'unité d'extraction de pseudo-enseignement (103). L'unité de classification de documents (203) classifie un document de menaces entré à classifier, à l'aide du modèle de classification généré à partir de l'apprentissage par l'unité d'apprentissage (104).
(JA) 分類装置(1)は、疑似教師抽出部(103)、学習部(104)及び、文書分類部(203)を有する。疑似教師抽出部(103)は、疑似的な教師データの作成ルールを基に、サイバー脅威に関する記述を有する脅威文書から疑似的な教師データを作成する。学習部(104)は、脅威文書及び疑似教師抽出部(103)により作成された疑似的な教師データを基に、ノイズモデル及び分類モデルを相互の関係を用いて並行して学習する。文書分類部(203)は、学習部(104)による学習により生成された分類モデルを用いて、入力された分類対象脅威文書の分類を行う。