WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Options
Query Language
Stem
Sort by:
List Length
Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2012124608) TOPIC EXTRACTION DEVICE AND PROGRAM
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2012/124608 International Application No.: PCT/JP2012/056004
Publication Date: 20.09.2012 International Filing Date: 08.03.2012
IPC:
G06F 17/30 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
Applicants: IWASAKI, Hideki[JP/JP]; null (UsOnly)
GOTO, Kazuyuki[JP/JP]; null (UsOnly)
MATSUMOTO, Shigeru[JP/JP]; null (UsOnly)
MIYABE, Yasunari[JP/JP]; null (UsOnly)
KOBAYASHI, Mikito[JP/JP]; null (UsOnly)
KABUSHIKI KAISHA TOSHIBA[JP/JP]; 1-1, Shibaura 1-chome, Minato-ku, Tokyo 1058001, JP (AllExceptUS)
TOSHIBA SOLUTIONS CORPORATION[JP/JP]; 1-1, Shibaura 1-chome, Minato-ku, Tokyo 1056691, JP (AllExceptUS)
Inventors: IWASAKI, Hideki; null
GOTO, Kazuyuki; null
MATSUMOTO, Shigeru; null
MIYABE, Yasunari; null
KOBAYASHI, Mikito; null
Agent: KURATA, Masatoshi; c/o SUZUYE & SUZUYE, 1-12-9, Toranomon, Minato-ku, Tokyo 1050001, JP
Priority Data:
2011-05449711.03.2011JP
Title (EN) TOPIC EXTRACTION DEVICE AND PROGRAM
(FR) DISPOSITIF ET PROGRAMME D'EXTRACTION DE THÈMES
(JA) 話題抽出装置及びプログラム
Abstract:
(EN) This embodiment of a topic extraction device is provided with a topic extraction means and a topic presentation means. The topic extraction means is provided with a term extraction means and a topic word extraction means. The term extraction means extracts each term from a target text corpus, and calculates the appearance frequency of each term and the frequency of texts in which each term appears. The topic word extraction means acquires a text corpus of text appearing in a target time period for each extracted term, calculates topicality, which is a measure indicating the degree to which a topic is spoken about, extracts terms for which the topicality is at least a predetermined value as topic words, and calculates the freshness of the extracted topic words on the basis of the appearance date in the target time period. The topic presentation means presents the extracted topic words in order of freshness, and presents the number of texts in which each presented topic word appears for each unit time period.
(FR) Selon un mode de réalisation, la présente invention concerne un dispositif d'extraction de thèmes équipé d'un moyen d'extraction de thèmes et d'un moyen de présentation de thèmes. Le moyen d'extraction de thèmes est équipé d'un moyen d'extraction de termes et un moyen d'extraction de mots thématiques. Le moyen d'extraction de termes extrait chaque terme à partir d'un ensemble de textes cible, et calcule la fréquence d'apparition de chaque terme et la fréquence des textes dans lesquels chaque terme apparaît. Le moyen d'extraction de mots thématiques acquiert un ensemble de textes de texte apparaissant dans une période de temps cible pour chaque terme extrait, calcule le caractère thématique, qui est une mesure indiquant le degré auquel un thème est mentionné, extrait des termes pour lesquels le caractère thématique est au moins une valeur prédéterminée sous forme de mots thématiques, et calcule la récence des mots thématiques extraits en fonction de la date d'apparition dans la période de temps cible. Le moyen de présentation de thèmes présente les mots thématiques extraits en ordre de proximité dans le temps, et présente le nombre de textes dans lesquels chaque mot thématique apparaît pour chaque période de temps unitaire.
(JA)  実施形態によれば、話題抽出装置は、話題抽出手段及び話題提示手段を備えている。前記話題抽出手段は、単語抽出手段及び話題語抽出手段を備えている。前記単語抽出手段は、対象文書集合から各単語を抽出し、当該各単語の出現頻度及び当該各単語が出現する文書頻度を算出する。前記話題語抽出手段は、前記抽出された各単語について、前記対象期間における出現文書の文書集合を取得し、話題語らしさを表す尺度である話題度を算出し、前記話題度が所定の値以上の単語を話題語として抽出すると共に、当該抽出された話題語について当該対象期間における出現日時に基づいて新鮮度を算出する。前記話題提示手段は、前記抽出された話題語を前記新鮮度の順に提示すると共に、当該提示した各話題語について単位期間毎の出現文書数を提示する。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)