処理中

しばらくお待ちください...

PATENTSCOPE は、メンテナンスのため次の日時に数時間サービスを休止します。サービス休止: 土曜日 31.10.2020 (7:00 午前 CET)
設定

設定

出願の表示

1. WO2011074698 - テキストマイニングシステム、テキストマイニング方法および記録媒体

公開番号 WO/2011/074698
公開日 23.06.2011
国際出願番号 PCT/JP2010/073060
国際出願日 15.12.2010
IPC
G06F 17/30 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
30情報検索;そのためのデータベース構造
G06F 19/00 2011.01
G物理学
06計算;計数
F電気的デジタルデータ処理
19特定の用途に特に適合したデジタル計算またはデータ処理の装置または方法
CPC
G06F 16/34
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
34Browsing; Visualisation therefor
出願人
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP] (AllExceptUS)
  • 石川 開 ISHIKAWA, Kai [JP]/[JP] (UsOnly)
  • 安藤 真一 ANDO, Shinichi [JP]/[JP] (UsOnly)
  • 田村 晃裕 TAMURA, Akihiro [JP]/[JP] (UsOnly)
発明者
  • 石川 開 ISHIKAWA, Kai
  • 安藤 真一 ANDO, Shinichi
  • 田村 晃裕 TAMURA, Akihiro
代理人
  • 下坂 直樹 SHIMOSAKA, Naoki
優先権情報
2009-28631817.12.2009JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) TEXT MINING SYSTEM, TEXT MINING METHOD AND RECORDING MEDIUM
(FR) SYSTÈME D'EXPLORATION DE TEXTE, PROCÉDÉ D'EXPLORATION DE TEXTE ET SUPPORT D'ENREGISTREMENT
(JA) テキストマイニングシステム、テキストマイニング方法および記録媒体
要約
(EN)
Disclosed are a text mining system, text mining method and recording medium for suppressing increase in cost of analysis for an analyst even if, when analyzing a plurality of data for analysis, the data are to be integrally analyzed. The text mining system comprises a data set generation unit for generating a data set for analysis that includes data for analysis that include text data; and a data set search unit for searching, from among data sets for analysis generated by the data set generation unit, for a data set for analysis wherein the feature representation coverage exceeds a value given beforehand, or the cost of analysis does not exceed a value given beforehand; wherein the feature representation coverage is the ratio of the number of feature representations included in a feature representation list which is a group of feature representations, which are representations satisfying predetermined conditions from among text data within the data set for analysis, to the number of feature representations among all data for analysis; and the cost of analysis is defined on the basis of the number of feature representations included in the data set for analysis.
(FR)
L'invention porte sur un système d'exploration de texte, un procédé d'exploration de texte et un support d'enregistrement destinés à supprimer une augmentation de coût d'analyse pour un analyste même si, lors de l'analyse d'une pluralité de données à analyser, les données doivent être intégralement analysées. Le système d'exploration de texte comprend une unité de génération d'ensemble de données pour générer un ensemble de données à analyser qui comprend des données à analyser qui comprennent des données de texte; et une unité de recherche d'ensemble de données pour rechercher, parmi des ensembles de données à analyser générés par l'unité de génération d'ensemble de données, un ensemble de données à analyser dans lequel la couverture de représentations caractéristiques dépasse une valeur donnée au préalable, ou le coût d'analyse ne dépasse pas une valeur donnée au préalable. La couverture de représentations caractéristiques est le rapport du nombre de représentations caractéristiques incluses dans une liste de représentations caractéristiques qui est un groupe de représentations caractéristiques, qui sont des représentations satisfaisant des conditions prédéterminées issues des données de texte dans l'ensemble de données à analyser, sur le nombre de représentations caractéristiques parmi toutes les données à analyser; et le coût d'analyse est défini sur la base du nombre de représentations caractéristiques incluses dans l'ensemble de données à analyser.
(JA)
複数の分析対象データを分析する場合に、これらを統合的に分析する場合でも、分析者の分析コストの増大を抑える。 テキストデータを含む分析対象データ含む分析対象データセットを生成するデータセット生成部と、データセット生成部が生成した分析対象データセットのうち、分析対象データセット中のテキストデータのうち所定の条件を満たす表現である特徴表現の集合である特徴表現リストに含まれる特徴表現の数が全分析対象データ中の特徴表現の数に占める割合である特徴表現網羅率が、予め与えられた値を越える、または、分析対象データセットに含まれる特徴表現の数に基づいて定められる分析コストが予め与えられた値を越えない、分析対象データセットを探索するデータセット探索部とを含む。
国際事務局に記録されている最新の書誌情報