処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2022044115 - 情報処理装置、情報処理方法、および、プログラム

公開番号 WO/2022/044115
公開日 03.03.2022
国際出願番号 PCT/JP2020/031997
国際出願日 25.08.2020
IPC
G06F 16/35 2019.1
G物理学
06計算;計数
F電気的デジタルデータ処理
16情報検索;そのためのデータベース構造;そのためのファイルシステム構造
30構造化されていないテキストデータのもの
35クラスタリング;分類
G06F 16/36 2019.1
G物理学
06計算;計数
F電気的デジタルデータ処理
16情報検索;そのためのデータベース構造;そのためのファイルシステム構造
30構造化されていないテキストデータのもの
36セマンティックツールの作成,例.オントロジーまたはシソーラス
CPC
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 16/36
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
36Creation of semantic tools, e.g. ontology or thesauri
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 森谷 高明 MORIYA Takaaki
  • 西尾 学 NISHIO Manabu
  • 山本 太三 YAMAMOTO Taizo
  • 三好 優 MIYOSHI Yu
  • 歌原 崇 UTAHARA Takashi
代理人
  • 三好 秀和 MIYOSHI Hidekazu
  • 工藤 理恵 KUDO Rie
優先権情報
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM
(FR) DISPOSITIF DE TRAITEMENT D’INFORMATIONS, PROCÉDÉ DE TRAITEMENT D’INFORMATIONS, ET PROGRAMME
(JA) 情報処理装置、情報処理方法、および、プログラム
要約
(EN) The present invention comprises: a word expression model construction unit 13 which extracts a plurality of words from document data, calculates a characteristic value for each of the plurality of words, and constructs a word expression model that includes the characteristic values of the plurality of words; a word similarity score calculation unit 14 which calculates a word similarity score between pairs of words included in the plurality of words; a word similarity score matrix calculation unit 15 which generates a word similarity score matrix with respect to the plurality of words, with the word similarity scores between the pairs of words as matrix elements; a waveform similarity score calculation unit 18 which uses time series data, in which a prescribed type of time variable pertaining to a plurality of items respectively corresponding to the plurality of words is represented as a waveform, to calculate a waveform similarity score between the waveforms of pairs of items included in the plurality of items; a waveform similarity score matrix calculation unit 19 which generates a waveform similarity score matrix with respect to the plurality of items, with the waveform similarity scores between the waveforms of the pairs of items as matrix elements; and a difference calculation unit 20 which calculates a difference between the word similarity score matrix and the waveform similarity score matrix as an unexpected correlation score between items.
(FR) La présente invention comprend : une unité de construction de modèle d'expression de mots (13) qui extrait une pluralité de mots à partir de données de document, calcule une valeur caractéristique pour chacun de la pluralité de mots, et construit un modèle d'expression de mots qui comprend les valeurs caractéristiques de la pluralité de mots ; une unité de calcul de score de similarité de mots (14) qui calcule un score de similarité de mots entre des paires de mots incluses dans la pluralité de mots ; une unité de calcul de matrice de scores de similarité de mots (15) qui génère une matrice de scores de similarité de mots par rapport à la pluralité de mots, avec les scores de similarité de mots entre les paires de mots en tant qu'éléments de matrice ; une unité de calcul de score de similarité de formes d'onde (18) qui utilise des données de série temporelle, dans lesquelles un type prescrit de variable de temps se rapportant à une pluralité d'éléments correspondant respectivement à la pluralité de mots est représenté sous la forme d'une forme d'onde, pour calculer un score de similarité de formes d'onde entre les formes d'onde de paires d'éléments incluses dans la pluralité d'éléments ; une unité de calcul de matrice de scores de similarité de formes d'onde (19) qui génère une matrice de scores de similarité de formes d'onde par rapport à la pluralité d'éléments, avec les scores de similarité de formes d'onde entre les formes d'onde des paires d'éléments en tant qu'éléments de matrice ; et une unité de calcul de différence (20) qui calcule une différence entre la matrice de scores de similarité de mots et la matrice de scores de similarité de formes d'onde en tant que score de corrélation inattendue entre des éléments.
(JA) 文書データから複数の単語を抽出し、前記複数の単語の特徴値をそれぞれ計算し、前記複数の単語の特徴値を含む単語表現モデルを構築する単語表現モデル構築部13と、前記複数の単語に含まれる2単語間の単語類似度をそれぞれ計算する単語類似度計算部14と、前記複数の単語について前記2単語間の単語類似度のそれぞれを行列の要素とする単語類似度行列を生成する単語類似度行列計算部15と、前記複数の単語に対応する複数の品目に関する所定種類の時間変動値を波形で示した時系列データを用いて、前記複数の品目に含まれる2品目の波形間の波形類似度をそれぞれ計算する波形類似度計算部18と、前記複数の品目について前記2品目の波形間の波形類似度のそれぞれを行列の要素とする波形類似度行列を生成する波形類似度行列計算部19と、前記単語類似度行列と前記波形類似度行列との差を品目間の相関の意外度として計算する差分計算部20と、を備える。
国際事務局に記録されている最新の書誌情報