処理中

しばらくお待ちください...

設定

設定

1. WO2015025978 - 文書分別システム及び文書分別方法並びに文書分別プログラム

公開番号 WO/2015/025978
公開日 26.02.2015
国際出願番号 PCT/JP2014/072199
国際出願日 25.08.2014
IPC
G06F 17/30 2006.01
G物理学
06計算;計数
F電気的デジタルデータ処理
17特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
30情報検索;そのためのデータベース構造
CPC
G06F 16/90344
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
903Querying
90335Query processing
90344by using string matching techniques
出願人
  • 株式会社UBIC UBIC, INC. [JP/JP]; 東京都港区港南2-12-23 明産高浜ビル7階 Meisan Takahama Building 7F, 2-12-23 Kounan, Minato-ku, Tokyo 1080075, JP
発明者
  • 守本 正宏 MORIMOTO Masahiro; JP
  • 武田 秀樹 TAKEDA Hideki; JP
  • 小野里 拓一 ONOZATO Hirokazu; JP
代理人
  • 白坂 一 SHIRASAKA, Hajime; JP
優先権情報
2013-17312923.08.2013JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) TEXT CLASSIFICATION SYSTEM, TEXT CLASSIFICATION METHOD, AND TEXT CLASSIFICATION PROGRAM
(FR) SYSTÈME DE CLASSIFICATION DE TEXTES, PROCÉDÉ DE CLASSIFICATION DE TEXTES ET PROGRAMME DE CLASSIFICATION DE TEXTES
(JA) 文書分別システム及び文書分別方法並びに文書分別プログラム
要約
(EN)
The present invention is provided with: a text extraction unit that extracts, as the subject of classification by a user, a classification text group containing a predetermined number of units of text from text information; a classification code receiving/imparting unit that receives a classification code, which is an identifier used when categorizing text and respectively imparted by a user, to the units of text contained in the classification text group; a related term database that registers related terms that appear frequently in the units of text to which the classification code has been imparted ahead of time; a score calculation unit that, on the basis of the related terms registered in the related term database or the classification code imparted by the classification code receiving/imparting unit, calculates a score that evaluates the strength of the connection between the classification code and the text contained in the text information; and an automatic classification unit that, in multiple stages, and on the basis of the score calculated by means of the score calculation unit or a keyword selected by the user, imparts classification codes to the text contained in the text information.
(FR)
La présente invention concerne : une unité d'extraction de textes qui extrait, en tant qu'objet de classification par un utilisateur, un groupe de textes de classification contenant un nombre prédéterminé d'unités de texte provenant d'informations de texte; une unité de recevant/communiquant des codes de classification, ladite unité recevant un code de classification qui est un identifiant utilisé lors de la catégorisation du texte et qui est transmis respectivement par un utilisateur aux unités de texte contenues dans le groupe de textes de classification; une base de données de termes associés qui enregistre des termes associés qui apparaissent fréquemment dans les unités de texte auxquelles le code de classification a été communiqué à l'avance; une unité de calcul de scores qui, sur la base des termes associés enregistrés dans la base de données de termes associés ou du code de classification communiqué par l'unité recevant/communiquant le code de classification, calcule un score qui évalue la force de la connexion entre le code de classification et le texte contenu dans les informations de texte; et une unité de classification automatique qui, en de multiples étapes et sur la base du score calculé au moyen de l'unité de calcul de scores ou d'un mot-clé sélectionné par l'utilisateur, communique des codes de classification pour le texte contenu dans les informations de texte.
(JA)
 本発明は、文書情報から所定数の文書を含む分別文書群を、ユーザによる分別対象として抽出する文書抽出部と、分別文書群に含まれる文書に対して、ユーザがそれぞれ付与した、文書を分類する際に用いる識別子である分別符号を受け付ける分別符号受付付与部と、分別符号があらかじめ付与された文書に頻出する関連用語を登録した関連用語データベースと、分別符号受付付与部によって受け付けられた分別符号、または関連用語データベースに登録された関連用語に基づいて、文書情報に含まれる文書と分別符号との結びつきの強さを評価したスコアを算出するスコア算出部と、ユーザによって選択されたキーワード、またはスコア算出部によって算出されたスコアに基づいて、多段階で、文書情報に含まれる文書に分別符号を付与する自動分別部とを備えている。
国際事務局に記録されている最新の書誌情報