Processing

Please wait...

Settings

Settings

1. WO2000043988 - FEATURE EXTRACTION OF MODULATION FOR AUTOMATIC SPEECH RECOGNITION

Publication Number WO/2000/043988
Publication Date 27.07.2000
International Application No. PCT/US2000/001591
International Filing Date 20.01.2000
Chapter 2 Demand Filed 17.08.2000
IPC
G10L 15/02 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
02Feature extraction for speech recognition; Selection of recognition unit
CPC
G10L 15/02
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
02Feature extraction for speech recognition; Selection of recognition unit
Applicants
  • INTERNATIONAL COMPUTER SCIENCE INSTITUTE [US/US]; 1947 Center Street, Suite 600 Berkeley, CA 94704-1198, US (AllExceptUS)
  • KINGSBURY, Brian, E., D. [US/US]; US (UsOnly)
  • GREENBERG, Steven [US/US]; US (UsOnly)
  • MORGAN, Nelson, H. [US/US]; US (UsOnly)
Inventors
  • KINGSBURY, Brian, E., D.; US
  • GREENBERG, Steven; US
  • MORGAN, Nelson, H.; US
Agents
  • TROESCH, Hans, R.; Fish & Richardson P.C. 2200 Sand Hill Road, Suite 100 Menlo Park, CA 94025-6936, US
Priority Data
09/318,59225.05.1999US
60/166,68420.01.1999US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) FEATURE EXTRACTION OF MODULATION FOR AUTOMATIC SPEECH RECOGNITION
(FR) EXTRACTION DE CARACTERISTIQUES POUR RECONNAISSANCE VOCALE AUTOMATIQUE
Abstract
(EN)
An automatic speech recognition apparatus and method with a front end feature extractor that improves recognition performance under adverse acoustic conditions are disclosed. The inventive feature extractor is characterized by a critical bandwith spectral resolution, an emphasis on slow changes in the spectral structure of the speech signal, and adaptive automatic gain control. The feature extractor includes a feature generator (30) configured to compute short-term parameters of the speech signal, a filter system (32) configured to filter the time sequences of the short-term parameters, and a normalizer (34) configured to normalize the filtered parameters with respect to one or more previous values of the filtered parameters. Accordingly, the feature extractor is operable to carry out the following steps: computing short-term parameters of the speech signal; filtering time sequences of the short-term parameters; and normalizing the filtered parameters with respect to one or more previous values of the filtered parameters. The steps of filtering and normalizing preferably are performed independently of one another.
(FR)
Cette invention concerne un dispositif et un procédé de reconnaissance vocale automatique avec un extracteur initial de caractéristiques qui améliore le pouvoir de reconnaissance vocales en conditions acoustiques défavorables. L'extracteur selon l'invention se caractérise par une résolution spectrale à largeur de bande critique, une accentuation des changements lents survenant dans la structure spectrale du signal vocal et une commande de gain automatique adaptative. Selon un mode de réalisation, l'extracteur comprend un générateur de caractéristiques (30) conçu pour calculer des paramètres de courte durée du signal vocal, un système de filtre (32) étudié pour filtrer les séquences de temps desdits paramètres, et un normaliser (34) prévu pour normaliser les paramètres filtrés par rapport à une ou plusieurs valeurs antérieures de tels paramètres. Par voie de conséquence, l'extracteur de caractéristiques peut s'acquitter des fonctions suivantes : calcul des paramètres de courte durée du signal vocal; filtrage des séquences de temps des paramètres de courte durée; et normalisation des paramètres filtrés par rapport à une ou plusieurs valeurs antérieures desdits paramètres. Les opérations de filtrage et de normalisation seront de préférence menées à bien indépendamment l'une de l'autre.
Also published as
Latest bibliographic data on file with the International Bureau