Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022009253 - INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND RECORDING MEDIUM

Publication Number WO/2022/009253
Publication Date 13.01.2022
International Application No. PCT/JP2020/026344
International Filing Date 06.07.2020
IPC
G06F 40/258 2020.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
258Heading extraction; Automatic titling; Numbering
Applicants
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP]
Inventors
  • 星野 綾子 HOSHINO, Ayako
Agents
  • 中村 聡延 NAKAMURA, Toshinobu
  • 江上 達夫 EGAMI, TATSUO
  • 三輪 浩誉 MIWA, Hiroshige
Priority Data
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND RECORDING MEDIUM
(FR) DISPOSITIF DE TRAITEMENT D'INFORMATIONS, PROCÉDÉ DE TRAITEMENT D'INFORMATIONS ET SUPPORT D'ENREGISTREMENT
(JA) 情報処理装置、情報処理方法、及び、記録媒体
Abstract
(EN) This information processing device generates a heading from a structured document. An acquisition means acquires structured documents including headings and text. A training data generation means generates training data in which headings are set as training labels, and subordinate elements to the headings are set as input data. A training means uses the training data to train a generation model for generating a heading from subordinate elements. A heading generation means uses the trained generation model to generate a heading included in a target document.
(FR) Selon l'invention, un dispositif de traitement d'informations produit un titre à partir d'un document structuré. Un moyen d'acquisition acquiert des documents structurés comprenant des titres et du texte. Un moyen de production de données d'entraînement produit des données d'entraînement dans lesquelles des titres sont définis en tant qu'étiquettes d'entraînement, et des éléments subordonnés aux titres sont définis en tant que données d'entrée. Un moyen d'apprentissage utilise les données d'entraînement pour entraîner un modèle de production pour qu'il produise un titre à partir d'éléments subordonnés. Un moyen de production de titre utilise le modèle de production entraîné pour produire un titre inclus dans un document cible.
(JA) 情報処理装置は、構造化文書から見出しを生成する。取得手段は、見出しとテキストを含む構造化文書を取得する。教師データ生成手段は、見出しを教師ラベルとし、当該見出しの下位要素を入力データとする教師データを生成する。訓練手段は、教師データを用いて、下位要素から見出しを生成する生成モデルを訓練する。見出し生成手段は、訓練済みの生成モデルを用いて、対象文書に含まれる見出しを生成する。
Latest bibliographic data on file with the International Bureau