処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020250266 - 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム

公開番号 WO/2020/250266
公開日 17.12.2020
国際出願番号 PCT/JP2019/022866
国際出願日 10.06.2019
IPC
G10L 25/30 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
27分析手法に特徴があるもの
30ニュートラル・ネットワークを用いるもの
G10L 25/51 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
48特定の用途に特に適合したもの
51比較または判別のためのもの
CPC
G10L 25/30
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
27characterised by the analysis technique
30using neural networks
G10L 25/51
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
48specially adapted for particular use
51for comparison or discrimination
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 芦原 孝典 ASHIHARA, Takanori
  • 篠原 雄介 SHINOHARA, Yusuke
  • 山口 義和 YAMAGUCHI, Yoshikazu
代理人
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
優先権情報
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) IDENTIFICATION MODEL LEARNING DEVICE, IDENTIFICATION DEVICE, IDENTIFICATION MODEL LEARNING METHOD, IDENTIFICATION METHOD, AND PROGRAM
(FR) DISPOSITIF D'APPRENTISSAGE DE MODÈLE D'IDENTIFICATION, DISPOSITIF D'IDENTIFICATION, PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'IDENTIFICATION, PROCÉDÉ D'IDENTIFICATION ET PROGRAMME
(JA) 識別モデル学習装置、識別装置、識別モデル学習方法、識別方法、プログラム
要約
(EN) Provided is an identification model learning device that improves an identification model for special speech audio. The identification model learning device comprises an identification model learning unit for learning an identification model that includes: an input layer in which a feature amount series for frame units of speech and learning data including a binary label indicating whether speech is special speech are used as a basis to input the feature amount series for the frame units and output an output result to an intermediate layer; one or more intermediate layers in which the output result of the input layer or of the directly precedent intermediate layer is used as input and a processing result is output; an integration layer in which the output result of the last intermediate layer is used as input and a processing result for a speech unit is output; and an output layer in which a label from the output of the integration layer is output.
(FR) L'invention concerne un dispositif d'apprentissage de modèle d'identification qui améliore un modèle d'identification pour un contenu audio vocal spécial. Le dispositif d'apprentissage de modèle d'identification comprend une unité d'apprentissage de modèle d'identification permettant d'apprendre un modèle d'identification qui comprend : une couche d'entrée dans laquelle une série de quantité de caractéristiques pour des unités de trame de parole et des données d'apprentissage comprenant une étiquette binaire indiquant si la parole est une parole spéciale sont utilisées comme base pour entrer la série de quantité de caractéristiques pour les unités de trame et délivrer en sortie un résultat de sortie à une couche intermédiaire ; une ou plusieurs couches intermédiaires dans lesquelles le résultat de sortie de la couche d'entrée ou de la couche intermédiaire directement précédente est utilisé en tant qu'entrée et un résultat de traitement est délivré en sortie ; une couche d'intégration dans laquelle le résultat de sortie de la dernière couche intermédiaire est utilisé comme entrée et un résultat de traitement pour une unité de parole est délivré en sortie ; et une couche de sortie dans laquelle une étiquette provenant de la sortie de la couche d'intégration est délivrée en sortie.
(JA) 特殊発話音声の識別モデルを改善する識別モデル学習装置を提供する。発話のフレーム単位の特徴量系列と、発話が特殊発話であるか否かの2値のラベルを含む学習データに基づいて、フレーム単位の特徴量系列を入力とし、中間層に出力結果を出力する入力層と、入力層または直前の中間層の出力結果を入力とし、処理結果を出力する1つ以上の中間層と、最後の中間層の出力結果を入力とし、発話単位の処理結果を出力する統合層と、統合層の出力からラベルを出力する出力層を含む識別モデルを学習する識別モデル学習部を含む。
関連特許文献
US17617264出願が移行したが国内段階でまだ公開されていないか、WIPO にデータを提供していない国への移行が通知されたか、あるいは出願の形式に問題があり、またはその他の理由で利用可能な状態でないため、PATENTSCOPE で表示できません。
国際事務局に記録されている最新の書誌情報