Processing

Please wait...

Settings

Settings

Goto Application

1. WO1984004620 - APPARATUS AND METHOD FOR SPEAKER INDEPENDENTLY RECOGNIZING ISOLATED SPEECH UTTERANCES

Publication Number WO/1984/004620
Publication Date 22.11.1984
International Application No. PCT/US1983/000750
International Filing Date 16.05.1983
IPC
G10L 15/00 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
G10L 25/87 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
78Detection of presence or absence of voice signals
87Detection of discrete points within a voice signal
CPC
G10L 15/00
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
G10L 25/87
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
78Detection of presence or absence of voice signals
87Detection of discrete points within a voice signal
Applicants
Inventors
Priority Data
null30.12.1899null
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) APPARATUS AND METHOD FOR SPEAKER INDEPENDENTLY RECOGNIZING ISOLATED SPEECH UTTERANCES
(FR) DISPOSITIF ET PROCEDE PERMETTANT DE RECONNAITRE DES EMISSIONS SONORES VOCALES INDEPENDAMMENT DU LOCUTEUR
Abstract
(EN)
Apparatus (Fig. 1) and method (Fig. 2) for identifying voice utterances or words includes the steps of generating the digitized signal (52) representing the utterance, determining the features of the digital representation including the zero crossing frequencies, energy, zero crossing rates (56), grouping the determined features into vowel, consonant an syllable groups and identifying the grouped features. The method includes the steps of companding (52) the digitized signal to generate a complete decodeable signal representation of the utterance over the dynamic energy range of the signal to achieve increased accuracy of speaker independent voice recognition. The method for recognizing an unknown word or speech utterance as one of a predefined set of words includes the steps of establishing at least one flag (feature indicator) which is set (60) when a predefined utterance pattern is present in the unknown speech utterance. At least the gross parameters of the unknown utterance are established, and a plurality of fine parameters of predefined representations of the unknown utterance are also established. The unknown speech utterance is tested to determine whether to set the flag, and the gross parameter representing the signal is determined. The predefined set of words is searched to identify at least one of them which is characterized by at least the gross parameters. Finally, it is determined whether the set of identified feature associated with the unknown word are adequate to identify the word.
(FR)
Dispositif (Figure 1) et procédé (Figure 2) permettant l"identification d"émissions sonores vocales ou de mots, consistant à produire le signal numérisé (52) représentant l"émission vocale, à déterminer les caractéristiques de la représentation numérique comprenant les fréquences de croisement zéro, l"énergie, les taux de croisement zéro (56), à grouper les caractéristiques déterminées en groupes de voyelles, consonnes et syllabes et à identifier les caractéristiques regroupées. Le procédé consiste à comprimer-dilater (52) le signal numérisé pour produire une représentation complète décodable du signal de l"émission vocale sur toute la gamme de l"énergie dynamique du signal de manière à accroître la précision de la reconnaissance vocale indépendamment du locuteur. Le procédé de reconnaissance d"un mot ou d"une émission vocale inconnu parmi un ensemble prédéfini de mots consiste à établir au moins un drapeau (indicateur de caractéristiques) qui est établi (60) lorsqu"un modèle prédéfini d"émission vocale est présent dans l"émission vocale inconnue. On établit au moins les paramètres bruts de l"émission vocale inconnue ainsi qu"une pluralité de paramètres fins de représentation prédéfinie de l"émission vocale inconnue. L"émission vocale inconnue est testée pour déterminer s"il y a lieu d"établir le drapeau et l"on détermine le paramètre brut représentant le signal. L"ensemble de mots prédéfini est trié pour identifier au moins un mot se caractérisant par au moins les paramètres bruts. On détermine finalement si l"ensemble de caractéristiques identifié associées au mot inconnu permet d"identifier le mot d"une manière adéquate.
Latest bibliographic data on file with the International Bureau