Processing

Please wait...

Settings

Settings

Goto Application

1. WO2021059968 - SPEECH RECOGNITION DEVICE, SPEECH RECOGNITION METHOD, AND PROGRAM

Publication Number WO/2021/059968
Publication Date 01.04.2021
International Application No. PCT/JP2020/033974
International Filing Date 08.09.2020
IPC
G10L 15/06 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
CPC
G10L 15/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Applicants
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP]
Inventors
  • 古明地 秀治 KOMEIJI Shuji
Agents
  • 速水 進治 HAYAMI Shinji
Priority Data
2019-17648427.09.2019JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) SPEECH RECOGNITION DEVICE, SPEECH RECOGNITION METHOD, AND PROGRAM
(FR) DISPOSITIF DE RECONNAISSANCE DE PAROLE, PROCÉDÉ DE RECONNAISSANCE DE PAROLE ET PROGRAMME
(JA) 音声認識装置、音声認識方法、およびプログラム
Abstract
(EN)
A speech recognition device (100) has: a speech playback unit (102) that plays back, in predetermined segments, speech-recognition target speech divided into the predetermined segments; a speech recognition unit (104) that recognizes, for each target speech segment, spoken speech which is a user repeating the target speech; a text information generation unit (106) that generates text information of the spoken speech on the basis of the recognition results of the speech playback unit (102); and a storage processing unit (108) that stores, as learning data and in association with one another, per-user identification information, spoken speech, and recognition results corresponding to the spoken speech. The speech recognition unit (104) performs recognition using a recognition engine learned from per-user learning data.
(FR)
La présente invention concerne un dispositif de reconnaissance de parole (100) qui comporte : une unité de lecture de parole (102) qui lit, dans des segments prédéterminés, une parole cible de reconnaissance de parole divisée en segments prédéterminés ; une unité de reconnaissance vocale (104) qui reconnaît, pour chaque segment de parole cible, une parole prononcée qui est un utilisateur répétant la parole cible ; une unité de génération d’informations de texte (106) qui génère des informations de texte de la parole prononcée sur la base des résultats de reconnaissance de l’unité de lecture de parole (102) ; et une unité de traitement de stockage (108) qui stocke, en tant que données d’apprentissage et en association les unes avec les autres, des informations d’identification par utilisateur, une parole prononcée et des résultats de reconnaissance correspondant à la parole prononcée. L’unité de reconnaissance vocale (104) effectue une reconnaissance au moyen d’un moteur de reconnaissance appris à partir de données d’apprentissage par utilisateur.
(JA)
音声認識装置(100)は、所定の区間毎に区切られた音声認識の対象音声を、所定の区間毎に再生する音声再生部(102)と、対象音声毎に、ユーザが当該対象音声を復唱した発話音声を認識する音声認識部(104)と、音声再生部(102)の認識結果に基づいて、当該発話音声のテキスト情報を生成するテキスト情報生成部(106)と、ユーザ別の識別情報と、発話音声および当該発話音声に対応する認識結果と、を関連付けて学習データとして記憶させる記憶処理部(108)と、を有し、音声認識部(104)は、ユーザ別の学習データにより学習された認識エンジンを用いて認識する。
Latest bibliographic data on file with the International Bureau