国際・国内特許データベース検索
このアプリケーションの一部のコンテンツは現在ご利用になれません。
この状況が続く場合は、次のお問い合わせ先までご連絡ください。ご意見・お問い合わせ
1. (WO2020009208) 抽出方法、抽出装置および抽出プログラム
国際事務局に記録されている最新の書誌情報第三者情報を提供

国際公開番号: WO/2020/009208 国際出願番号: PCT/JP2019/026736
国際公開日: 09.01.2020 国際出願日: 04.07.2019
IPC:
G06F 16/36 (2019.01) ,G06F 17/22 (2006.01)
[IPC code unknown for G06F 16/36]
G 物理学
06
計算;計数
F
電気的デジタルデータ処理
17
特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20
自然言語データの取扱い
21
テキスト処理
22
符号の使用による操作または登録,例.テキスト文字列におけるもの
出願人:
日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP/JP]; 東京都千代田区大手町一丁目5番1号 5-1, Otemachi 1-chome, Chiyoda-ku, Tokyo 1008116, JP
発明者:
山嵜 麿与 YAMASAKI, Mayo; JP
川邊 秀樹 KAWABE, Hideki; JP
代理人:
特許業務法人酒井国際特許事務所 SAKAI INTERNATIONAL PATENT OFFICE; 東京都千代田区霞が関3丁目8番1号 虎の門三井ビルディング Toranomon Mitsui Building, 8-1, Kasumigaseki 3-chome, Chiyoda-ku, Tokyo 1000013, JP
優先権情報:
2018-12834105.07.2018JP
発明の名称: (EN) EXTRACTION METHOD, EXTRACTION DEVICE, AND EXTRACTION PROGRAM
(FR) PROCÉDÉ, DISPOSITIF ET PROGRAMME D'EXTRACTION
(JA) 抽出方法、抽出装置および抽出プログラム
要約:
(EN) A paragraph dividing unit (15a) divides a document having markup information applied thereto that indicates a vertex of a graph structure, dividing same into paragraphs. A vertex extraction unit (15b) extracts a vertex for each paragraph. An edge extraction unit (15c) extracts edges between extracted vertices, for each paragraph. A storage unit (14) stores a schema (14a) that specifies edges between the attributes of vertices in the graph structure. The paragraph dividing unit (15a) divides into paragraphs a document having marking information applied thereto that indicates vertices in the graph structure and attributes of the vertices. The vertex extraction unit (15b) extracts the vertices and the attributes of the vertices, for each paragraph. The edge extraction unit (15c) can extract an edge specified in the schema (14a), for each paragraph. The vertex joining unit (15d) can join extracted vertices that are duplicated between paragraphs.
(FR) Selon la présente invention, une unité de division en paragraphes (15a) divise un document auquel des informations de balisage sont appliquées, ces dernières indiquant un sommet d'une structure de graphe, en le divisant en paragraphes. Une unité d'extraction de sommets (15b) extrait un sommet pour chaque paragraphe. Une unité d'extraction de bords (15c) extrait des bords entre des sommets extraits, pour chaque paragraphe. Une unité de mémoire (14) enregistre un schéma (14a) qui spécifie des bords entre les attributs des sommets dans la structure de graphe. L'unité de division en paragraphes (15a) divise en paragraphes un document auquel des informations de marquage sont appliquées pour indiquer des sommets dans la structure de graphe et des attributs des sommets. L'unité d'extraction de sommets (15b) extrait les sommets et les attributs des sommets, pour chaque paragraphe. L'unité d'extraction de bords (15c) peut extraire un bord spécifié dans le schéma (14a), pour chaque paragraphe. L'unité de jonction de sommets (15d) peut rejoindre des sommets extraits qui sont dupliqués entre des paragraphes.
(JA) 段落分割部(15a)が、グラフ構造の頂点を示すマークアップ情報が付与された文書を、段落ごとのまとまりに分割し、頂点抽出部(15b)が、段落ごとに、頂点を抽出し、辺抽出部(15c)が、段落ごとに、抽出された頂点間の辺を抽出する。記憶部(14)が、グラフ構造の頂点の属性間の辺を特定するスキーマ(14a)を記憶し、段落分割部(15a)が、グラフ構造の頂点と該頂点の属性とを示すマークアップ情報が付与された文書を、段落ごとのまとまりに分割し、頂点抽出部(15b)が、段落ごとに、頂点と該頂点の属性とを抽出し、辺抽出部(15c)が、段落ごとに、スキーマ(14a)において特定されている辺を抽出してもよい。頂点結合部(15d)が、段落間で重複して抽出された頂点を結合してもよい。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関 (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)