Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020162239 - DISPOSITIF D'APPRENTISSAGE DE MODÈLE D'ESTIMATION D'INFORMATIONS PARALINGUISTIQUES, DISPOSITIF D'ESTIMATION D'INFORMATIONS PARALINGUISTIQUES, ET PROGRAMME

Numéro de publication WO/2020/162239
Date de publication 13.08.2020
N° de la demande internationale PCT/JP2020/002649
Date du dépôt international 27.01.2020
CIB
G10L 15/10 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
10utilisant des mesures de distance ou de distorsion entre la parole inconnue et les gabarits de référence
G10L 15/16 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
16utilisant des réseaux neuronaux artificiels
G10L 25/63 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes G10L15/-G10L21/146
48spécialement adaptées pour un usage particulier
51pour comparaison ou différentiation
63pour estimer un état émotionnel
CPC
G10L 15/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
G10L 25/63
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
48specially adapted for particular use
51for comparison or discrimination
63for estimating an emotional state
Déposants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
Inventeurs
  • 安藤 厚志 ANDO, Atsushi
  • 神山 歩相名 KAMIYAMA, Hosana
  • 小橋川 哲 KOBASHIKAWA, Satoshi
Mandataires
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
Données relatives à la priorité
2019-02133208.02.2019JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) PARALINGUISTIC INFORMATION ESTIMATION MODEL LEARNING DEVICE, PARALINGUISTIC INFORMATION ESTIMATION DEVICE, AND PROGRAM
(FR) DISPOSITIF D'APPRENTISSAGE DE MODÈLE D'ESTIMATION D'INFORMATIONS PARALINGUISTIQUES, DISPOSITIF D'ESTIMATION D'INFORMATIONS PARALINGUISTIQUES, ET PROGRAMME
(JA) パラ言語情報推定モデル学習装置、パラ言語情報推定装置、およびプログラム
Abrégé
(EN)
The present invention estimates paralinguistic information with high accuracy even when an utterance using which the paralinguistic information is difficult to specify is used for model learning. An acoustic feature extraction unit 11 extracts an acoustic feature from an utterance. On the basis of a paralinguistic information label indicating the assessment result of paralinguistic information given to each of utterances by a plurality of listeners, an inverse teacher determination unit 12 determines an inverse teacher label indicating an inverse teacher that is not the correct answer of paralinguistic information of the utterance. On the basis of the acoustic feature extracted from the utterance and the inverse teacher label, an inverse teacher estimation model learning unit 13 learns an inverse teacher estimation model outputting the posterior probability of the inverse teacher with respect to the inputted acoustic feature.
(FR)
La présente invention estime des informations paralinguistiques avec une grande précision même lorsqu'un énoncé à l'aide duquel les informations paralinguistiques sont difficiles à spécifier est utilisé pour un apprentissage de modèle. Une unité d'extraction de caractéristiques acoustiques 11 extrait une caractéristique acoustique d'un énoncé. Sur la base d'une étiquette d'informations paralinguistiques indiquant le résultat d'évaluation d'informations paralinguistiques fournies à chacun des énoncés par une pluralité d'auditeurs, une unité de détermination d'enseignant inverse 12 détermine une étiquette d'enseignant inverse indiquant un enseignant inverse qui n'est pas la réponse correcte d'informations parallèles de l'énoncé. Sur la base de la caractéristique acoustique extraite de l'énoncé et de l'étiquette d'enseignant inverse, une unité d'apprentissage de modèle d'estimation d'enseignant inverse 13 apprend un modèle d'estimation d'enseignant inverse délivrant en sortie la probabilité postérieure de l'enseignant inverse par rapport à la caractéristique acoustique entrée.
(JA)
パラ言語情報を特定することが困難である発話をモデル学習に用いた場合であっても、高精度にパラ言語情報を推定する。音響特徴抽出部11は、発話から音響特徴を抽出する。逆教師決定部12は、複数の聴取者が発話ごとに付与したパラ言語情報の判定結果を表すパラ言語情報ラベルに基づいて、その発話のパラ言語情報の正解ではない逆教師を表す逆教師ラベルを決定する。逆教師推定モデル学習部13は、発話から抽出した音響特徴と逆教師ラベルとに基づいて、入力された音響特徴に対する逆教師の事後確率を出力する逆教師推定モデルを学習する。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international