WIPO logo
Mobile | Deutsch | English | Español | Français | 한국어 | Português | Русский | 中文 | العربية |

World Intellectual Property Organization
1. (WO2010055663) 文書解析装置および方法

Translation翻訳: 原文 > 日本語
国際公開番号:    WO/2010/055663    国際出願番号:    PCT/JP2009/006040
国際公開日: 20.05.2010 国際出願日: 12.11.2009
G06F 17/30 (2006.01)
出願人: SCIENCE CRAFT LTD. [JP/JP]; 5-1, Horai-cho, Echizen-shi, Fukui 9150074 (JP) (米国を除く全ての指定国).
HAYASHI, Haruo [JP/JP]; (JP) (米国のみ)
発明者: HAYASHI, Haruo; (JP)
代理人: YAMADA, Yoshito; (JP)
2008-289835 12.11.2008 JP
(JA) 文書解析装置および方法
要約: front page image
(EN)A document analysis device for displaying the changed state of a discriminating word as a behavior graph of the discriminating word or a singular value chart of the discriminating word by calculating the sum of the singular values of the discriminating word extracted by a computer.  A text corpus containing more unit documents later in terms of an order reference than those earlier is created.  An analysis of the residual between the estimated sum of the increasing TFIDFs of a morpheme for the corpus created earlier in terms of the order reference and the sum of the increasing TFIDFs of the morpheme actually calculated for the objective corpus is made.  The morpheme having a positive singular value is selected as a discriminating word in the current corpus according to the result of the residual analysis, and the changed state of the discriminating word, such as a moving average line is visually outputted.
(FR)L'invention porte sur un dispositif d'analyse de document pour afficher l'état changé d'un mot discriminant sous la forme d'un graphe comportemental du mot discriminant ou d'un graphique de valeur singulière du mot discriminant par calcul de la somme des valeurs singulières du mot discriminant extrait par un ordinateur. Un corpus de texte contenant davantage de documents unitaires plus tardifs en termes d'une référence d'ordre que ceux plus précoces est créé. Une analyse du résidu entre la somme estimée et les TFIDF croissants d'un morphème pour le corpus créé de façon plus précoce en termes de la référence d'ordre et la somme des TFIDF croissants du morphème réellement calculé pour le corpus objectif est réalisée. Le morphème ayant une valeur singulière positive est choisi en tant que mot discriminant dans le corpus actuel selon le résultat de l'analyse de résidu, et l'état changé du mot discriminant, tel qu'une ligne moyenne mobile, est visuellement présenté.
(JA) 文書解析装置では、コンピュータが、抽出した特異語の累積特異値を計算することによって、その特異語のふるまいグラフや特異語の特異値チャートのように、特異語の変化の状態を可視化して表示できる。つまり、順序基準に従った順序が後のものが先のものに比べて多い数の単位ドキュメントを含むテキストコーパスを作成し、順序基準が前のコーパスにおいて推定しておいた該当の形態素の増加型TFIDFの累計値の推定値と、対象のコーパスにおいて計算した増加型TFIDFの累計値の実測値との間で残差分析を行ない、その残差分析の結果、正の特異値が得られた形態素を当該コーパスにおける特異語として選定し、その特異語の変化の状態、たとえば移動平均線などを可視的に出力する。
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
欧州特許庁(EPO) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
国際公開言語: Japanese (JA)
国際出願言語: Japanese (JA)