処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020241071 - データ生成モデル学習装置、データ生成装置、データ生成モデル学習方法、データ生成方法、プログラム

公開番号 WO/2020/241071
公開日 03.12.2020
国際出願番号 PCT/JP2020/015792
国際出願日 08.04.2020
IPC
G06N 3/04 2006.1
G物理学
06計算;計数
N特定の計算モデルに基づくコンピュータ・システム
3生物学的モデルに基づくコンピュータシステム
02ニューラルネットワークモデルを用いるもの
04アーキテクチャ,例.網構造
G06N 3/08 2006.1
G物理学
06計算;計数
N特定の計算モデルに基づくコンピュータ・システム
3生物学的モデルに基づくコンピュータシステム
02ニューラルネットワークモデルを用いるもの
08学習方法
G10L 15/10 2006.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
10未知音声と標準パタンとの距離または歪みを用いるもの
G10L 15/16 2006.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
16ニューラル・ネットワークを用いるもの
G10L 25/30 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
27分析手法に特徴があるもの
30ニュートラル・ネットワークを用いるもの
CPC
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
G10L 25/30
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
27characterised by the analysis technique
30using neural networks
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
  • 国立大学法人東京大学 THE UNIVERSITY OF TOKYO [JP]/[JP]
発明者
  • 柏野 邦夫 KASHINO, Kunio
  • 井川 翔太 IKAWA, Shota
代理人
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
優先権情報
2019-09730824.05.2019JP
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) DATA GENERATION MODEL LEARNING DEVICE, DATA GENERATION DEVICE, DATA GENERATION MODEL LEARNING METHOD, DATA GENERATION METHOD, AND PROGRAM
(FR) DISPOSITIF D'APPRENTISSAGE DE MODÈLE DE GÉNÉRATION DE DONNÉES, DISPOSITIF DE GÉNÉRATION DE DONNÉES, PROCÉDÉ D'APPRENTISSAGE DE MODÈLE DE GÉNÉRATION DE DONNÉES, PROCÉDÉ DE GÉNÉRATION DE DONNÉES ET PROGRAMME
(JA) データ生成モデル学習装置、データ生成装置、データ生成モデル学習方法、データ生成方法、プログラム
要約
(EN) Provided is technology for controlling an index for a prescribed natural language expression to generate, from an audio signal, a natural language expression corresponding to the audio signal. A data generation device 200 includes: a latent variable generation unit 210 that uses an encoder to generate, from an audio signal, a latent variable corresponding to the audio signal; and a data generation unit 220 that uses a decoder to generate a natural language expression corresponding to the audio signal from a condition relating to an index for a natural language expression and the latent variable.
(FR) L'invention concerne une technologie pour commander un indice pour qu'une expression en langage naturel prescrite génère, à partir d'un signal audio, une expression en langage naturel correspondant au signal audio. Un dispositif de génération de données (200) comprend : une unité de génération de variable latente (210) qui utilise un codeur pour générer, à partir d'un signal audio, une variable latente correspondant au signal audio; et une unité de génération de données (220) qui utilise un décodeur pour générer une expression en langage naturel correspondant au signal audio à partir d'une condition relative à un indice pour une expression en langage naturel et la variable latente.
(JA) 音響信号から、所定の自然言語表現に対する指標を制御して、当該音響信号に対応する自然言語表現を生成する技術を提供する。データ生成装置200は、音響信号から、エンコーダを用いて、前記音響信号に対応する潜在変数を生成する潜在変数生成部210と、前記潜在変数と自然言語表現に対する指標に関する条件から、デコーダを用いて、前記音響信号に対応する自然言語表現を生成するデータ生成部220と、を含む。
国際事務局に記録されている最新の書誌情報