このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2017009900) 文書処理システム及び文書処理方法
国際事務局に記録されている最新の書誌情報   

国際公開番号: WO/2017/009900 国際出願番号: PCT/JP2015/069910
国際公開日: 19.01.2017 国際出願日: 10.07.2015
IPC:
G06F 17/27 (2006.01)
[IPC code unknown for G06F 17/27]
出願人:
株式会社日立製作所 HITACHI, LTD. [JP/JP]; 東京都千代田区丸の内一丁目6番6号 6-6, Marunouchi 1-chome, Chiyoda-ku, Tokyo 1008280, JP
発明者:
高橋 寿一 TAKAHASHI, Toshikazu; JP
岩山 真 IWAYAMA, Makoto; JP
新庄 広 SHINJO, Hiroshi; JP
小林 義行 KOBAYASHI, Yoshiyuki; JP
尾崎 太亮 OZAKI, Hiroaki; JP
間瀬 久雄 MASE, Hisao; JP
童 彬 TONG, Bin; JP
代理人:
特許業務法人藤央特許事務所 TOU-OU PATENT FIRM; 東京都港区虎ノ門一丁目16番4号アーバン虎ノ門ビル Urban Toranomon Bldg., 16-4, Toranomon 1-chome, Minato-ku, Tokyo 1050001, JP
優先権情報:
発明の名称: (EN) DOCUMENT PROCESSING SYSTEM AND DOCUMENT PROCESSING METHOD
(FR) SYSTÈME DE TRAITEMENT DE DOCUMENT ET PROCÉDÉ DE TRAITEMENT DE DOCUMENT
(JA) 文書処理システム及び文書処理方法
要約:
(EN) In this document processing system: a learning dictionary having registered therein a physical structure of an elements included in a paragraph that should be extracted from document data and an information aggregation present in a region of the element is stored in a storage region; and a processor divides the document data into at least one region, acquires an information aggregation present in the divided region, calculates the level of physical structure agreement indicative of the level of agreement between the region in which the acquired information aggregation is present and the physical structure of the element registered in the learning dictionary, calculates the level of information aggregation agreement indicative of the level of agreement between the acquired information aggregation and the information aggregation registered in the learning dictionary, determines whether or not the divided region is the paragraph that should be extracted on the basis of the calculated level of physical structure agreement and level of information aggregation agreement, and registers the acquired information aggregation in the learning dictionary when the divided region is the paragraph that should be extracted.
(FR) L'invention concerne un système de traitement de document qui comprend : un dictionnaire d'apprentissage dans lequel est enregistrée une structure physique d'un élément inclus dans un paragraphe qui doit être extrait de données de document et un regroupement d'informations présent dans une région de l'élément est stocké dans une région de stockage ; et un processeur divise les données de document dans au moins une région, acquiert un regroupement d'informations présent dans la région divisée, calcule le niveau de concordance de structure physique indiquant le niveau de concordance entre la région dans laquelle le regroupement d'informations acquis est présent, et la structure physique de l'élément enregistré dans le dictionnaire d'apprentissage, calcule le niveau de concordance de regroupement d'informations indiquant le niveau de concordance entre le regroupement d'informations acquis et le regroupement d'informations enregistré dans le dictionnaire d'apprentissage, détermine si la région divisée est, ou non, le paragraphe qui doit être extrait sur la base du niveau calculé de concordance de structure physique et du niveau de concordance de regroupement d'informations, et enregistre le regroupement d'informations acquis dans le dictionnaire d'apprentissage lorsque la région divisée est le paragraphe qui doit être extrait.
(JA) 文書処理システムであって、記憶領域には、文書データから抽出すべき段落に含まれる要素の物理構造と、当該要素の領域に存在する情報集合と、が登録された学習辞書が記憶され、プロセッサは、文書データを少なくとも一つの領域に分割し、分割した領域に存在する情報集合を取得し、取得した情報集合の存在領域と学習辞書に登録された要素の物理構造との一致度を示す物理構造一致度を算出し、取得した情報集合と学習辞書に登録された情報集合との一致度を示す情報集合一致度を算出し、算出した物理構造一致度及び情報集合一致度に基づいて、分割した領域が抽出すべき段落であるか否かを判定し、分割した領域が抽出すべき段落である場合、取得した情報集合を学習辞書に登録する。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)