Processing

Please wait...

Settings

Settings

Goto Application

1. WO2009008055 - SPEECH RECOGNIZER, SPEECH RECOGNITION METHOD, AND SPEECH RECOGNITION PROGRAM

Publication Number WO/2009/008055
Publication Date 15.01.2009
International Application No. PCT/JP2007/063688
International Filing Date 09.07.2007
IPC
G10L 15/06 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
CPC
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 2015/025
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
02Feature extraction for speech recognition; Selection of recognition unit
025Phonemes, fenemes or fenones being the recognition units
Applicants
  • 富士通株式会社 FUJITSU LIMITED [JP]/[JP] (AllExceptUS)
  • 原田将治 HARADA, Shouji (UsOnly)
Inventors
  • 原田将治 HARADA, Shouji
Agents
  • 特許業務法人池内・佐藤アンドパートナーズ IKEUCHI SATO & PARTNER PATENT ATTORNEYS
Priority Data
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) SPEECH RECOGNIZER, SPEECH RECOGNITION METHOD, AND SPEECH RECOGNITION PROGRAM
(FR) DISPOSITIF DE RECONNAISSANCE DE LA PAROLE, PROCÉDÉ DE RECONNAISSANCE DE LA PAROLE ET PROGRAMME DE RECONNAISSANCE DE LA PAROLE
(JA) 音声認識装置、音声認識方法、および、音声認識プログラム
Abstract
(EN)
A speech recognizer (1) comprises a speech collating section (17) for calculating similarities at each time between the amount of a feature converted by a speech analysis section (11) and word models generated by a word model generating section (16). The speech collating section (17) extracts the word model in which the minimum similarity in the similarities at each time or the entire similarity obtained from the similarities at each time out of the word models generated by the word model generating section (16) satisfies a second threshold condition, and in which similarities at each time in the section corresponding to the phoneme or the phoneme string associated with the first threshold condition out of the speech sections of utterance speech satisfy the first threshold condition and outputs the recognized word corresponding to the extracted word model as the result of the recognition.
(FR)
L'invention porte sur un dispositif de reconnaissance de la parole (1). Le dispositif comprend une section de collationnement de parole (17) pour calculer des similarités à chaque moment entre la quantité d'une caractéristique convertie par une section d'analyse de la parole (11) et des modèles de mot générés par une section de génération de modèle de mot (16). La section de collationnement de parole (17) extrait le modèle de mot dans lequel la similarité minimale parmi les similarités à chaque moment ou la similarité entière obtenue à partir des similarités à chaque moment générées par des modèles de mot générés par la section de génération de modèle de mot (16) satisfait une deuxième condition de seuil, et dans lequel les similarités à chaque moment dans la section correspondant au phonème ou à la chaîne de phonèmes associé à la première condition de seuil générée par les sections de parole énoncée satisfont à la première condition de seuil ; et délivre en sortie le mot reconnu correspondant au modèle de mot extrait après la reconnaissance.
(JA)
 音声認識装置(1)は、音声分析部(11)により変換された特徴量と、単語モデル生成部(16)により生成された単語モデルとの各時刻における類似度を算出する音声照合部(17)を備える。音声照合部(17)は、単語モデル生成部(16)により生成された単語モデルのうち、各時刻における類似度の中で最小の類似度あるいは各時刻における類似度から得られる全体類似度が第2閾値条件を満たし、かつ、発話音声の発声区間のうち、第1閾値条件に対応付けられた音素または音素列に対応する区間内の各時刻における類似度が第1閾値条件を満たす単語モデルを抽出し、抽出した単語モデルに対応する認識単語を認識結果として出力する。
Latest bibliographic data on file with the International Bureau