処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020241070 - 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム

公開番号 WO/2020/241070
公開日 03.12.2020
国際出願番号 PCT/JP2020/015791
国際出願日 08.04.2020
IPC
G06F 16/65 2019.1
G物理学
06計算;計数
F電気的デジタルデータ処理
16情報検索;そのためのデータベース構造;そのためのファイルシステム構造
60音声データ
65クラスタリング;分類
CPC
G06F 16/65
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
60of audio data
65Clustering; Classification
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
  • 国立大学法人東京大学 THE UNIVERSITY OF TOKYO [JP]/[JP]
発明者
  • 柏野 邦夫 KASHINO, Kunio
  • 井川 翔太 IKAWA, Shota
代理人
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
優先権情報
2019-09731024.05.2019JP
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) AUDIO SIGNAL RETRIEVING DEVICE, AUDIO SIGNAL RETRIEVING METHOD, DATA RETRIEVING DEVICE, DATA RETRIEVING METHOD, AND PROGRAM
(FR) DISPOSITIF DE RÉCUPÉRATION DE SIGNAL AUDIO, PROCÉDÉ DE RÉCUPÉRATION DE SIGNAL AUDIO, DISPOSITIF DE RÉCUPÉRATION DE DONNÉES, PROCÉDÉ DE RÉCUPÉRATION DE DONNÉES ET PROGRAMME
(JA) 音響信号検索装置、音響信号検索方法、データ検索装置、データ検索方法、プログラム
要約
(EN) Provided is audio signal retrieving technology capable of retrieving an audio signal without tagging by text data. The present invention includes: a storage unit that stores an audio signal database comprising a record containing an audio signal and a latent variable which was generated from the audio signal using an audio signal encoder and which corresponds to the audio signal; a latent variable generation unit that uses a natural language expression encoder to generate, from a natural language expression serving as input (hereinafter referred to as the "input natural language expression), a latent variable corresponding to the input natural language expression; and a retrieving unit that uses the audio signal database to determine, from the latent variable corresponding to the input natural language expression, an audio signal corresponding to the input natural language expression, the audio signal serving as a retrieval result.
(FR) L'invention concerne une technologie de récupération de signal audio capable de récupérer un signal audio sans marquage par des données texte. La présente invention comprend : une unité de stockage qui stocke une base de données de signaux audio comprenant un enregistrement contenant un signal audio et une variable latente qui a été générée à partir du signal audio à l'aide d'un codeur de signal audio et qui correspond au signal audio; une unité de génération de variable latente qui utilise un codeur d'expression de langage naturel pour générer, à partir d'une expression de langage naturel servant d'entrée (appelée ci-après expression de langage naturel d'entrée), une variable latente correspondant à l'expression de langage naturel d'entrée; et une unité de récupération qui utilise la base de données de signaux audio pour déterminer, à partir de la variable latente correspondant à l'expression de langage naturel d'entrée, un signal audio correspondant à l'expression de langage naturel d'entrée, le signal audio servant de résultat de récupération.
(JA) テキストデータによりタグ付けすることなく、音響信号を検索することができる音響信号検索技術を提供する。音響信号エンコーダを用いて音響信号から生成した、当該音響信号に対応する潜在変数と、当該音響信号とを含むレコードから構成される音響信号データベースを記録する記録部と、入力となる自然言語表現(以下、入力自然言語表現という)から、自然言語表現エンコーダを用いて、前記入力自然言語表現に対応する潜在変数を生成する潜在変数生成部と、前記音響信号データベースを用いて、前記入力自然言語表現に対応する潜在変数から、前記入力自然言語表現に対応する音響信号を検索結果として決定する検索部と、を含む。
Related patent documents
JP2021522679This application is not viewable in PATENTSCOPE because the national phase entry has not been published yet or the national entry is issued from a country that does not share data with WIPO or there is a formatting issue or an unavailability of the application.
国際事務局に記録されている最新の書誌情報