処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020202324 - 文書解析装置、文書解析方法、及びコンピュータ読み取り可能な記録媒体

公開番号 WO/2020/202324
公開日 08.10.2020
国際出願番号 PCT/JP2019/014200
国際出願日 29.03.2019
IPC
G06F 17/27 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20自然言語データの取扱い
27自動言語解析,例.構文解析,綴字訂正
G06F 17/22 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20自然言語データの取扱い
21テキスト処理
22符号の使用による操作または登録,例.テキスト文字列におけるもの
出願人
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP]
発明者
  • 星野 綾子 HOSHINO, Ayako
代理人
  • 特許業務法人ブライタス BRIGHTAS IP ATTORNEYS
優先権情報
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) DOCUMENT ANALYSIS DEVICE, DOCUMENT ANALYSIS METHOD, AND COMPUTER-READABLE RECORDING MEDIUM
(FR) DISPOSITIF D'ANALYSE DE DOCUMENT, PROCÉDÉ D'ANALYSE DE DOCUMENT ET SUPPORT D'ENREGISTREMENT LISIBLE PAR ORDINATEUR
(JA) 文書解析装置、文書解析方法、及びコンピュータ読み取り可能な記録媒体
要約
(EN)
A document analysis device 10 is provided with: a candidate generation unit 11 which, for each line constituting a target document to be subjected to structural analysis, extracts a marker indicating a hierarchical layer from the line and thereby identifies other lines that are in a parallel relationship with the line, wherein the candidate generation unit 11 generates one or more hierarchical structure candidates for the target document on the basis of the identification results for each line; and a candidate evaluation unit 12 which, if two or more hierarchical structure candidates are generated, evaluates each hierarchical structure candidate, and selects, on the basis of the evaluation results, one of the hierarchical structure candidates as the hierarchical structure of the target document.
(FR)
La présente invention concerne un dispositif d'analyse de document 10 qui comporte : une unité de génération de candidat 11 qui, pour chaque ligne constituant un document cible à soumettre à une analyse structurale, extrait un marqueur indiquant une couche hiérarchique à partir de la ligne et identifie ainsi d'autres lignes qui sont dans une relation parallèle avec la ligne, l'unité de génération de candidat 11 générant une ou plusieurs structures hiérarchiques candidates pour le document cible sur la base des résultats d'identification pour chaque ligne ; et une unité d'évaluation de candidat 12 qui, si au moins deux structures hiérarchiques candidates sont générées, évalue chaque structure hiérarchique candidate, et sélectionne, sur la base des résultats d'évaluation, l'une des structures hiérarchiques candidates en tant que structure hiérarchique du document cible.
(JA)
文書解析装置10は、構造の解析の対象となる文書を構成している行毎に、階層を示すマーカの抽出を行うことによって、当該行と並列の関係にある他の行を特定し、行毎の特定の結果に基づいて、対象となる文書の階層構造の候補を生成する、候補生成部11と、候補が2以上生成されている場合に、階層構造の候補毎に評価を行い、評価結果に基づいて、階層構造の候補の1つを、対象となる文書の階層構造として選択する、候補評価部12と、を備えている。
国際事務局に記録されている最新の書誌情報