Processing

Please wait...

Settings

Settings

Goto Application

1. WO2006048998 - KEYWORD EXTRACTING DEVICE

Publication Number WO/2006/048998
Publication Date 11.05.2006
International Application No. PCT/JP2005/018712
International Filing Date 11.10.2005
Chapter 2 Demand Filed 31.08.2006
IPC
G06F 17/30 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
30Information retrieval; Database structures therefor
CPC
G06F 16/313
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
31Indexing; Data structures therefor; Storage structures
313Selection or weighting of terms for indexing
Applicants
  • 株式会社アイ・ピー・ビー INTELLECTUAL PROPERTY BANK CORP. [JP]/[JP] (AllExceptUS)
  • 増山 博昭 MASUYAMA, Hiroaki [JP]/[JP] (UsOnly)
  • 佐藤 晴正 SATO, Haru-Tada [JP]/[JP] (UsOnly)
  • 浅田 誠 ASADA, Makoto [JP]/[JP] (UsOnly)
  • 蓮子 和巳 HASUKO, Kazumi [JP]/[JP] (UsOnly)
  • 堀田 任晃 HOTTA, Hideaki [JP]/[JP] (UsOnly)
Inventors
  • 増山 博昭 MASUYAMA, Hiroaki
  • 佐藤 晴正 SATO, Haru-Tada
  • 浅田 誠 ASADA, Makoto
  • 蓮子 和巳 HASUKO, Kazumi
  • 堀田 任晃 HOTTA, Hideaki
Agents
  • 保坂 延寿 HOSAKA, Nobuhisa
Priority Data
2004-32292405.11.2004JP
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) KEYWORD EXTRACTING DEVICE
(FR) DISPOSITIF D’EXTRACTION DE MOTS-CLÉ
(JA) キーワード抽出装置
Abstract
(EN) A keyword extracting device comprises high-frequency word extracting means (30) for extracting high-frequency words which are index words having great weights and containing the level of the frequency in a document group (E) consisting of documents (D) in the evaluation from the index words (w) contained in the document group (E), clustering means (50) clustering the high-frequency words according to the cooccurrence degree C based on the presence/absence of occurrence in units of one document with the index words (w) in the document group (E), score calculating means (70) for calculating the score key (w) of each index word (w) while highly estimating index words (w), out of the index words (w), which coocurs with the high-frequency word belonging to more clusters (g) and with the high-frequency words in more documents (D), and keyword extracting means (90) for extracting keywords according to the score. With this, keywords indicating the feature of a document group consisting of documents can be automatically extracted.
(FR) Le dispositif d’extraction de mots-clé comprend un moyen d’extraction de mots-clé très fréquents (30) pour extraire des mots très fréquents qui sont des mots d’index ayant un grand poids et contenant l’indication de fréquence dans un groupe de documents (E) consistant en documents (D) dans l’évaluation à partir des mots d’index (w) contenus dans le groupe de documents (E), un moyen de regroupement (50) regroupant les mots très fréquents en fonction du degré de cooccurrence (C) basé sur la présence/absence d’occurrences dans des unités d’un document avec les mots d’index (w) dans le groupe de documents (E), un moyen de calcul de score (70) pour calculer la clé de score (w) de chaque mot d’index (w) tout en estimant fortement ceux des mots d’index (w) présents simultanément avec le mot très fréquent appartenant à plusieurs regroupements (g) et avec les mots très fréquents figurant dans plusieurs documents (D), et un moyen d’extraction de mot-clé (90) pour extraire des mots-clé en fonction du score. Ainsi, des mots-clé indiquant la caractéristique d’un groupe de documents peuvent être extraits automatiquement.
(JA) キーワード抽出装置は、複数の文書Dからなる文書群Eに含まれる索引語wのうち前記文書群Eにおける出現頻度の高さを評価に含む重みの大きい索引語である高頻度語を抽出する高頻度語抽出手段30と、前記高頻度語を、前記文書群Eにおける前記索引語wの各々との文書単位での共起有無に基づく共起度Cに基づいてクラスタリングするクラスタリング手段50と、前記索引語wのうち、より多くのクラスタgに属する高頻度語と共起し、且つより多くの文書Dにおいて前記高頻度語と共起するものを、より高く評価したスコアkey(w)を個々の索引語wにつき算出するスコア算出手段70と、前記スコアに基づいてキーワードを抽出するキーワード抽出手段90と、を備える。これにより、複数の文書からなる文書群の特徴を表すキーワードを自動抽出する。
Latest bibliographic data on file with the International Bureau