Traitement en cours

Veuillez attendre...

PATENTSCOPE sera indisponible durant quelques heures pour des raisons de maintenance le mardi 27.07.2021 à 12:00 PM CEST
Paramétrages

Paramétrages

Aller à Demande

1. WO2020162190 - DISPOSITIF D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE, PROCÉDÉ D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE ET PROGRAMME

Numéro de publication WO/2020/162190
Date de publication 13.08.2020
N° de la demande internationale PCT/JP2020/002207
Date du dépôt international 23.01.2020
CIB
G10L 15/06 2013.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
06Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
G10L 15/16 2006.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
16utilisant des réseaux neuronaux artificiels
CPC
G10L 15/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
Déposants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
Inventeurs
  • 松井 清彰 MATSUI, Kiyoaki
  • 森谷 崇史 MORIYA, Takafumi
  • 福冨 隆朗 FUKUTOMI, Takaaki
  • 篠原 雄介 SHINOHARA, Yusuke
  • 山口 義和 YAMAGUCHI, Yoshikazu
  • 岡本 学 OKAMOTO, Manabu
Mandataires
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
Données relatives à la priorité
2019-01847805.02.2019JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) ACOUSTIC MODEL LEARNING DEVICE, ACOUSTIC MODEL LEARNING METHOD, AND PROGRAM
(FR) DISPOSITIF D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE, PROCÉDÉ D'APPRENTISSAGE DE MODÈLE ACOUSTIQUE ET PROGRAMME
(JA) 音響モデル学習装置、音響モデル学習方法、プログラム
Abrégé
(EN)
Provided is technology for learning an acoustic model, having a certain level of voice recognition accuracy with a short calculation time. This acoustic model learning device includes: a loss calculation unit that uses an acoustic model to calculate a loss of voice data, which is an element of a learning corpus Cj; a curriculum corpus generation unit that generates a curriculum corpus which is the sum of partial collections of learning corpuses Cj using as elements voice data within a prescribed range indicating little loss; an acoustic model updating unit that uses the curriculum corpus to update the acoustic model; and a first end condition determination unit that outputs the acoustic model if a prescribed end condition is satisfied, and transfers execution control to the loss calculation unit if the prescribed end condition is not satisfied. The acoustic model updating unit updates the acoustic model by weighting a gradient for the voice data that is a curriculum corpus element, such weighting using a weight for the voice data, the weight becoming smaller as the number of times the voice data is selected as a curriculum corpus element increases.
(FR)
La présente invention concerne une technologie d'apprentissage d'un modèle acoustique, ayant un certain niveau de précision de reconnaissance vocale avec un temps de calcul court. Ce dispositif d'apprentissage de modèle acoustique comprend : une unité de calcul de perte qui utilise un modèle acoustique pour calculer une perte de données vocales, qui constituent un élément d'un corpus d'apprentissage Cj; une unité de génération de corpus de curriculum qui génère un corpus de curriculum qui est la somme de collections partielles de corpus d'apprentissage Cj en utilisant comme éléments des données vocales dans une plage prescrite indiquant une perte faible; une unité de mise à jour de modèle acoustique qui utilise le corpus de curriculum pour mettre à jour le modèle acoustique; et une première unité de détermination de condition de fin qui délivre le modèle acoustique si une condition de fin prescrite est satisfaite et transfère une commande d'exécution à l'unité de calcul de perte si la condition de fin prescrite n'est pas satisfaite. L'unité de mise à jour de modèle acoustique met à jour le modèle acoustique en pondérant un gradient pour les données vocales qui constituent un élément de corpus de curriculum, une telle pondération utilisant une pondération pour les données vocales, la pondération diminuant à mesure de l'augmentation du nombre de sélections des données vocales comme élément de corpus de curriculum.
(JA)
少ない計算時間で一定の音声認識精度を有する音響モデルを学習する技術を提供する。音響モデルを用いて学習用コーパスCjの要素である音声データのロスを計算するロス計算部と、ロスが小さいことを示す所定の範囲にある音声データを要素とする学習用コーパスCjの部分集合の和であるカリキュラムコーパスを生成するカリキュラムコーパス生成部と、カリキュラムコーパスを用いて音響モデルを更新する音響モデル更新部と、所定の終了条件を満たす場合は音響モデルを出力し、所定の終了条件を満たさない場合はロス計算部に実行制御を移す第1終了条件判定部とを含む音響モデル学習装置であって、音響モデル更新部は、音声データがカリキュラムコーパスの要素として選定された回数が大きいほど小さくなるような音声データに対する重みを用いて、カリキュラムコーパスの要素である音声データに対する勾配を重み付けして音響モデルを更新する。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international