(EN) Provided is an identification model learning device that improves an identification model for special speech audio. The identification model learning device comprises an identification model learning unit for learning an identification model that includes: an input layer in which a feature amount series for frame units of speech and learning data including a binary label indicating whether speech is special speech are used as a basis to input the feature amount series for the frame units and output an output result to an intermediate layer; one or more intermediate layers in which the output result of the input layer or of the directly precedent intermediate layer is used as input and a processing result is output; an integration layer in which the output result of the last intermediate layer is used as input and a processing result for a speech unit is output; and an output layer in which a label from the output of the integration layer is output.
(FR) L'invention concerne un dispositif d'apprentissage de modèle d'identification qui améliore un modèle d'identification pour un contenu audio vocal spécial. Le dispositif d'apprentissage de modèle d'identification comprend une unité d'apprentissage de modèle d'identification permettant d'apprendre un modèle d'identification qui comprend : une couche d'entrée dans laquelle une série de quantité de caractéristiques pour des unités de trame de parole et des données d'apprentissage comprenant une étiquette binaire indiquant si la parole est une parole spéciale sont utilisées comme base pour entrer la série de quantité de caractéristiques pour les unités de trame et délivrer en sortie un résultat de sortie à une couche intermédiaire ; une ou plusieurs couches intermédiaires dans lesquelles le résultat de sortie de la couche d'entrée ou de la couche intermédiaire directement précédente est utilisé en tant qu'entrée et un résultat de traitement est délivré en sortie ; une couche d'intégration dans laquelle le résultat de sortie de la dernière couche intermédiaire est utilisé comme entrée et un résultat de traitement pour une unité de parole est délivré en sortie ; et une couche de sortie dans laquelle une étiquette provenant de la sortie de la couche d'intégration est délivrée en sortie.
(JA) 特殊発話音声の識別モデルを改善する識別モデル学習装置を提供する。発話のフレーム単位の特徴量系列と、発話が特殊発話であるか否かの2値のラベルを含む学習データに基づいて、フレーム単位の特徴量系列を入力とし、中間層に出力結果を出力する入力層と、入力層または直前の中間層の出力結果を入力とし、処理結果を出力する1つ以上の中間層と、最後の中間層の出力結果を入力とし、発話単位の処理結果を出力する統合層と、統合層の出力からラベルを出力する出力層を含む識別モデルを学習する識別モデル学習部を含む。