Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2003005343 - RECHERCHE RAPIDE EN RECONNAISSANCE VOCALE

Numéro de publication WO/2003/005343
Date de publication 16.01.2003
N° de la demande internationale PCT/IB2002/002440
Date du dépôt international 21.06.2002
CIB
G10L 15/08 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
CPC
G10L 15/083
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
083Recognition networks
Déposants
  • KONINKLIJKE PHILIPS ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1 NL-5621 BA Eindhoven, NL
Inventeurs
  • SEIDE, Frank, T., B.; NL
Mandataires
  • GÖSSMANN, Klemens; Internationaal Octrooibureau B.V. Prof. Holstlaan 6 NL-5656 AA Eindhoven, NL
Données relatives à la priorité
01202609.206.07.2001EP
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) FAST SEARCH IN SPEECH RECOGNITION
(FR) RECHERCHE RAPIDE EN RECONNAISSANCE VOCALE
Abrégé
(EN)
Speech recognition involves searching for the most likely one of a number of sequences of words, given a speech signal. Each such sequence is a composite sequence, composed of consecutive sequences of states. Searching involves a number of searches, each in a respective search space containing a subset of the sequences of states. In each search only the more likely sequences of states in the relevant search space are considered. In a first embodiment different search spaces are made up of sequences of states that follow preceding sequences from a class of sequences of words. Different classes define different ones of the search spaces. Classes are distinguished on the basis of phonetic history rather than word history, as represented by the sequences of states in the composite sequence up to the sequence of states in the search space. Thus, the number of words or parts thereof whose identity is used to distinguish different classes is varied depending on a length of one or more last words represented by the composite sequence. In a second embodiment, a plurality different composite sequences are involved in a search through a joint sequence of states, for which representative likelihood information for the plurality is used to decide whether or not to discard it in the search. At the end of the search the likelihood for the different composite sequences is regenerated from the joint sequence if it survived the search, and further search is based on the regenerated likelihood. In a third embodiment, this technique is applied within searches at the subword level.
(FR)
La reconnaissance vocale implique la recherche d'une séquence à vraisemblance maximale d'un nombre de séquences de mots, générant un signal vocal. Chacune de ces séquences est une séquence composite constituée de séquences d'états consécutives. La recherche implique un nombre de recherches, chaque espace contenant un sous-ensemble de séquences d'états. Dans chaque recherche, seules les séquences d'état à vraisemblance maximale de l'espace de recherche considéré sont pris en compte. Selon une première réalisation, différents espaces de recherche sont constitués de séquences d'états qui suivent les séquences précédentes depuis une classe de séquences de mots. Différentes classent définissent différents espaces de recherche. On distingue les classes sur la base de l'historique phonétique plutôt que sur l'historique des mots comme le représentent les séquences d'états de la séquence composite jusqu'à la séquence d'états de l'espace de recherche. Ainsi, le nombre de mots ou parties dont l'identité est utilisée pour distinguer différentes classes varie en fonction d'une longueur d'au moins un des derniers mots représentés par la séquence composite. Selon une seconde réalisation, une pluralité de séquences composites différentes sont impliquées dans une recherche par l'intermédiaire d'une séquence d'états adjointe pour laquelle des informations de vraisemblance représentatives de la pluralité de séquences sont utilisées pour déterminer s'il faut ou non les supprimer dans la recherche. A la fin de la recherche, la vraisemblance des différentes séquences composites est régénérée à partir de la séquence adjointe si elle résiste à la recherche, et une autre recherche est basée sur la vraisemblance régénérée. Selon une troisième réalisation, cette technique est appliquée dans des recherches au niveau des sous-mots.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international