処理中

しばらくお待ちください...

設定

設定

Goto Application

1. WO2020067313 - 固有表現抽出装置、方法および記憶媒体

公開番号 WO/2020/067313
公開日 02.04.2020
国際出願番号 PCT/JP2019/037915
国際出願日 26.09.2019
IPC
G06F 17/21 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20自然言語データの取扱い
21テキスト処理
G06F 17/27 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20自然言語データの取扱い
27自動言語解析,例.構文解析,綴字訂正
CPC
G06F 16/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
G06F 16/30
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
G06F 40/242
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
237Lexical tools
242Dictionaries
G06F 40/289
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
出願人
  • 株式会社 東芝 KABUSHIKI KAISHA TOSHIBA [JP]/[JP]
  • 東芝デジタルソリューションズ株式会社 TOSHIBA DIGITAL SOLUTIONS CORPORATION [JP]/[JP]
発明者
  • 飛田 義賢 TOBITA, Yoshikata
  • 鈴木 優 SUZUKI, Masaru
代理人
  • 蔵田 昌俊 KURATA, Masatoshi
  • 野河 信久 NOGAWA, Nobuhisa
  • 井上 正 INOUE, Tadashi
  • 河野 直樹 KOHNO, Naoki
優先権情報
2018-18386128.09.2018JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) NAMED ENTITY EXTRACTION DEVICE, METHOD, AND STORAGE MEDIUM
(FR) DISPOSITIF D'EXTRACTION D'ENTITÉ NOMMÉE, PROCÉDÉ, ET SUPPORT DE STOCKAGE
(JA) 固有表現抽出装置、方法および記憶媒体
要約
(EN)
A named entity extraction device in an embodiment of the present invention has: a means (20) in which an extraction dictionary is stored, the extraction dictionary being used when a named entity and a relationship between named entities are each extracted from document data; a document reception means (11) that receives the input of extraction document data, which is the extraction object, and the input of learning document data; an extraction means (20) that uses the extraction dictionary to extract the named entity and the relationship from the extraction document data; an indication means (13) that indicates a character string, from among character strings in the learning document data, that corresponds to the named entity to be extracted; a means (16) in which a relationship extraction rule for extracting from the extraction document data is stored, a relationship of categories of named entities being set in the relationship extraction rule; a generation means (17) that applies the relationship extraction rule, thereby generating a learning document in which is set a relationship of named entities belonging to the category of the relationship extraction rule, among indicated named entities; and a learning means (19) that learns the extraction dictionary on the basis of the learning document.
(FR)
Un dispositif d'extraction d'entité nommée dans un mode de réalisation de la présente invention comprend : un moyen (20) dans lequel un dictionnaire d'extraction est stocké, le dictionnaire d'extraction étant utilisé lorsqu'une entité nommée et une relation entre des entités nommées sont chacune extraites de données de document ; un moyen de réception de document (11) qui reçoit l'entrée de données de document d'extraction, qui est l'objet d'extraction, et l'entrée de données de document d'apprentissage ; un moyen d'extraction (20) qui utilise le dictionnaire d'extraction pour extraire l'entité nommée et la relation à partir des données de document d'extraction ; un moyen d'indication (13) qui indique une chaîne de caractères, parmi des chaînes de caractères dans les données de document d'apprentissage, qui correspond à l'entité nommée à extraire ; un moyen (16) dans lequel une règle d'extraction de relation pour extraire à partir des données de document d'extraction est stockée, une relation de catégories d'entités nommées étant définie dans la règle d'extraction de relation ; un moyen de génération (17) qui applique la règle d'extraction de relation, générant ainsi un document d'apprentissage dans lequel est établie une relation d'entités nommées appartenant à la catégorie de la règle d'extraction de relation, parmi les entités nommées indiquées ; et un moyen d'apprentissage (19) qui apprend le dictionnaire d'extraction sur la base du document d'apprentissage.
(JA)
実施形態における固有表現抽出装置は、文書データから固有表現と固有表現同士の関係とがそれぞれ抽出されるときに用いられる抽出用辞書が格納される手段(20)と、抽出対象である抽出用文書データの入力および学習用文書データの入力をそれぞれ受け付ける文書受付手段(11)と、抽出用辞書を用いて抽出用文書データから固有表現および関係を抽出する抽出手段(20)と、学習用文書データにおける文字列のうち抽出させる固有表現に対応する文字列を指定する指定手段(13)と、抽出用文書データから抽出させる、固有表現の分類同士の関係が定められた関係抽出ルールが格納される手段(16)と、関係抽出ルールを適用することで、指定された固有表現のうち関係抽出ルールの分類に属する固有表現同士の関係が設定された学習文書を生成する生成手段(17)と、学習文書に基づいて抽出用辞書を学習する学習手段(19)とを有する。
他の公開
国際事務局に記録されている最新の書誌情報