処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020110815 - キーワード抽出装置、キーワード抽出方法、およびプログラム

公開番号 WO/2020/110815
公開日 04.06.2020
国際出願番号 PCT/JP2019/045160
国際出願日 19.11.2019
IPC
G10L 15/10 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
10未知音声と標準パタンとの距離または歪みを用いるもの
G10L 15/16 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
16ニューラル・ネットワークを用いるもの
CPC
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/16
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
16using artificial neural networks
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 中村 孝 NAKAMURA, Takashi
  • 田中 智大 TANAKA, Tomohiro
代理人
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
優先権情報
2018-22443530.11.2018JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) KEYWORD EXTRACTION DEVICE, KEYWORD EXTRACTION METHOD, AND PROGRAM
(FR) DISPOSITIF D'EXTRACTION DE MOT-CLÉ, PROCÉDÉ D'EXTRACTION DE MOT-CLÉ ET PROGRAMME
(JA) キーワード抽出装置、キーワード抽出方法、およびプログラム
要約
(EN)
The present invention robustly extracts a keyword even if a speech recognition result includes an error. A model storage unit 10 stores a keyword extraction model for receiving input of word vector representations of a plurality of words, and extracting and outputting a word vector representation of a keyword. An utterance detection unit 11 detects an utterance part from a speech signal. A speech recognition unit 12 performs speech recognition on the utterance part of the speech signal, and outputs a confusion network which is the result of the speech recognition. A word vector representation generation unit 13 generates a word vector representation including the reliability of speech recognition for each candidate word for individual confusion sets. A keyword extraction unit 14 inputs the word vector representations of the candidate words in the descending order of reliability to the keyword extraction model, and acquires the word vector representation of the keyword.
(FR)
La présente invention extrait de manière robuste un mot-clé même si un résultat de reconnaissance vocale comporte une erreur. Une unité de stockage de modèle (10) stocke un modèle d'extraction de mot-clé pour recevoir une entrée de représentations vectorielles de mot d'une pluralité de mots, et extraire et délivrer en sortie une représentation vectorielle de mot d'un mot-clé. Une unité de détection d'énoncés (11) détecte une partie d'énoncé à partir d'un signal vocal. Une unité de reconnaissance vocale (12) réalise une reconnaissance vocale sur la partie d'énoncé du signal vocal, et délivre un réseau de confusion qui est le résultat de la reconnaissance vocale. Une unité de génération de représentation vectorielle de mots (13) génère une représentation vectorielle de mots comprenant la fiabilité de la reconnaissance vocale pour chaque mot candidat pour des ensembles de confusion individuels. Une unité d'extraction de mot-clé (14) entre les représentations vectorielles de mot des mots candidats dans l'ordre décroissant de fiabilité au modèle d'extraction de mot-clé, et acquiert la représentation vectorielle de mot du mot-clé.
(JA)
誤りを含む音声認識結果であっても頑健にキーワードを抽出する。モデル記憶部10は、複数の単語の単語ベクトル表現を入力とし、キーワードの単語ベクトル表現を抽出して出力するキーワード抽出モデルを記憶する。発話検出部11は、音声信号から発話部分を検出する。音声認識部12は、音声信号の発話部分を音声認識し、その音声認識結果であるコンフュージョンネットワークを出力する。単語ベクトル表現生成部13は、コンフュージョンセットごとに、各候補単語について音声認識の信頼度を含む単語ベクトル表現を生成する。キーワード抽出部14は、候補単語の単語ベクトル表現を信頼度が高い順にキーワード抽出モデルへ入力し、キーワードの単語ベクトル表現を得る。
他の公開
国際事務局に記録されている最新の書誌情報