Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2005006308 - RECONNAISSANCE VOCALE POUR LES LARGES VOCABULAIRES DYNAMIQUES

Numéro de publication WO/2005/006308
Date de publication 20.01.2005
N° de la demande internationale PCT/FR2004/001799
Date du dépôt international 08.07.2004
CIB
G10L 15/08 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
G10L 15/14 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
14utilisant des modèles statistiques, p.ex. des modèles de Markov cachés
CPC
G10L 15/083
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
083Recognition networks
G10L 15/144
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
14using statistical models, e.g. Hidden Markov Models [HMMs]
142Hidden Markov Models [HMMs]
144Training of HMMs
Déposants
  • TELISMA [FR/FR]; Technopole Anticipa 9, rue Blaise Pascal F-22300 Lannion, FR (AllExceptUS)
  • COGNE, Laurent [FR/FR]; FR (UsOnly)
  • LE HUITOUZE, Serge [FR/FR]; FR (UsOnly)
  • SOUFFLET, Frédéric [FR/FR]; FR (UsOnly)
Inventeurs
  • COGNE, Laurent; FR
  • LE HUITOUZE, Serge; FR
  • SOUFFLET, Frédéric; FR
Mandataires
  • BREESE, Pierre ; Breese Derambure Majerowicz 38, avenue de l'Opéra F-75002 Paris, FR
Données relatives à la priorité
03/0834108.07.2003FR
Langue de publication français (FR)
Langue de dépôt français (FR)
États désignés
Titre
(EN) VOICE RECOGNITION FOR LARGE DYNAMIC VOCABULARIES
(FR) RECONNAISSANCE VOCALE POUR LES LARGES VOCABULAIRES DYNAMIQUES
Abrégé
(EN)
The invention relates to a voice recognition method comprising a representation stage of a vocabulary translated into a Markhov model; a decoding stage by a Viterbi algorithm and a pruning stage for solutions explored. The invention is characterized in that the vocabulary is described in the form of a tree consisting of arcs and nodes between which phonetic units used by the application language model are defined, and in that the Markhov network required for the Viterbi decoding is at least partially constructed in a dynamic manner by means of Markhovian sub-units. The invention also relates to a voice recognition system used to carry out the above-mentioned method.
(FR)
La présente invention se rapporte à un procédé de reconnaissance vocale comportant une étape de représentation d'un vocabulaire traduit en un modèle de Markov, une étape de décodage par un algorithme de Viterbi et une étape d'élagage des solutions explorées, caractérisé en ce que ledit vocabulaire est décrit sous forme d'un arbre composé d'arcs et de nœuds entre lesquels sont définies des transcriptions décrivant les unités phonétiques utilisées par le modèle de langage de l' application, et en ce que le réseau de Markov nécessaire au décodage de Viterbi est construit au moins en partie de manière dynamique grâce à des sous-unités Markoviennes. La présente invention se rapporte également à un système de reconnaissance vocale pour la mise en œuvre du procédé.
Également publié en tant que
US2007038451
Dernières données bibliographiques dont dispose le Bureau international