Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020110815 - DISPOSITIF D'EXTRACTION DE MOT-CLÉ, PROCÉDÉ D'EXTRACTION DE MOT-CLÉ ET PROGRAMME

Numéro de publication WO/2020/110815
Date de publication 04.06.2020
N° de la demande internationale PCT/JP2019/045160
Date du dépôt international 19.11.2019
CIB
G10L 15/10 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
10utilisant des mesures de distance ou de distorsion entre la parole inconnue et les gabarits de référence
G10L 15/16 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
16utilisant des réseaux neuronaux artificiels
CPC
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
Déposants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
Inventeurs
  • 中村 孝 NAKAMURA, Takashi
  • 田中 智大 TANAKA, Tomohiro
Mandataires
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
Données relatives à la priorité
2018-22443530.11.2018JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) KEYWORD EXTRACTION DEVICE, KEYWORD EXTRACTION METHOD, AND PROGRAM
(FR) DISPOSITIF D'EXTRACTION DE MOT-CLÉ, PROCÉDÉ D'EXTRACTION DE MOT-CLÉ ET PROGRAMME
(JA) キーワード抽出装置、キーワード抽出方法、およびプログラム
Abrégé
(EN)
The present invention robustly extracts a keyword even if a speech recognition result includes an error. A model storage unit 10 stores a keyword extraction model for receiving input of word vector representations of a plurality of words, and extracting and outputting a word vector representation of a keyword. An utterance detection unit 11 detects an utterance part from a speech signal. A speech recognition unit 12 performs speech recognition on the utterance part of the speech signal, and outputs a confusion network which is the result of the speech recognition. A word vector representation generation unit 13 generates a word vector representation including the reliability of speech recognition for each candidate word for individual confusion sets. A keyword extraction unit 14 inputs the word vector representations of the candidate words in the descending order of reliability to the keyword extraction model, and acquires the word vector representation of the keyword.
(FR)
La présente invention extrait de manière robuste un mot-clé même si un résultat de reconnaissance vocale comporte une erreur. Une unité de stockage de modèle (10) stocke un modèle d'extraction de mot-clé pour recevoir une entrée de représentations vectorielles de mot d'une pluralité de mots, et extraire et délivrer en sortie une représentation vectorielle de mot d'un mot-clé. Une unité de détection d'énoncés (11) détecte une partie d'énoncé à partir d'un signal vocal. Une unité de reconnaissance vocale (12) réalise une reconnaissance vocale sur la partie d'énoncé du signal vocal, et délivre un réseau de confusion qui est le résultat de la reconnaissance vocale. Une unité de génération de représentation vectorielle de mots (13) génère une représentation vectorielle de mots comprenant la fiabilité de la reconnaissance vocale pour chaque mot candidat pour des ensembles de confusion individuels. Une unité d'extraction de mot-clé (14) entre les représentations vectorielles de mot des mots candidats dans l'ordre décroissant de fiabilité au modèle d'extraction de mot-clé, et acquiert la représentation vectorielle de mot du mot-clé.
(JA)
誤りを含む音声認識結果であっても頑健にキーワードを抽出する。モデル記憶部10は、複数の単語の単語ベクトル表現を入力とし、キーワードの単語ベクトル表現を抽出して出力するキーワード抽出モデルを記憶する。発話検出部11は、音声信号から発話部分を検出する。音声認識部12は、音声信号の発話部分を音声認識し、その音声認識結果であるコンフュージョンネットワークを出力する。単語ベクトル表現生成部13は、コンフュージョンセットごとに、各候補単語について音声認識の信頼度を含む単語ベクトル表現を生成する。キーワード抽出部14は、候補単語の単語ベクトル表現を信頼度が高い順にキーワード抽出モデルへ入力し、キーワードの単語ベクトル表現を得る。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international