Traitement en cours

Veuillez attendre...

PATENTSCOPE sera indisponible durant quelques heures pour des raisons de maintenance le dimanche 05.04.2020 à 10:00 AM CEST
Paramétrages

Paramétrages

1. WO2003005344 - PROCEDE ET APPAREIL DE COMMANDE DE FAISCEAU DYNAMIQUE EN RECHERCHE VITERBI

Numéro de publication WO/2003/005344
Date de publication 16.01.2003
N° de la demande internationale PCT/RU2001/000264
Date du dépôt international 03.07.2001
CIB
G10L 15/08 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
G10L 15/12 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
08Classement ou recherche de la parole
12utilisant des techniques de programmation dynamique, p.ex. normalisation temporelle par comparaison dynamique
CPC
G10L 15/08
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
G10L 15/12
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
12using dynamic programming techniques, e.g. dynamic time warping [DTW]
G10L 2015/085
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
085Methods for reducing search complexity, pruning
Déposants
  • INTEL ZAO [RU/RU]; Sokol-10 Business Center Chapaevsky per., 14, RU (AL, AM, AT, AU, AZ, BA, BB, BE, BF, BG, BJ, BR, BY, CA, CF, CG, CH, CI, CM, CN, CU, CY, CZ, DE, DK, EE, ES, FI, FR, GA, GB, GE, GH, GM, GN, GR, GW, HR, HU, ID, IE, IL, IS, IT, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MC, MD, MG, MK, ML, MN, MR, MW, MX, MZ, NE, NL, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, SN, SZ, TD, TG, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZW)
  • KIBKALO, Alexandr A. [RU/RU]; RU (UsOnly)
  • BARANNIKOV, Vyacheslav A. [RU/RU]; RU (UsOnly)
Inventeurs
  • KIBKALO, Alexandr A.; RU
  • BARANNIKOV, Vyacheslav A.; RU
Mandataires
  • TKACHENKO, Valeria Sergeevna; 000 "Sojuzpatent" ul. Iliinka, 5/2 Moscow, 103735, RU
Données relatives à la priorité
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) METHOD AND APPARATUS FOR DYNAMIC BEAM CONTROL IN VITERBI SEARCH
(FR) PROCEDE ET APPAREIL DE COMMANDE DE FAISCEAU DYNAMIQUE EN RECHERCHE VITERBI
Abrégé
(EN)
A method is presented including selecting an initial beam width. The method also includes determining whether a value per frame is changing. A beam width is dynamically adjusted. The method further decides a speech input with the dynamically adjusted beam width. Also, a device is presented including a processor (420). A speech recognition component (610) is connected to the processor (420). A memory (410) is connected to the processor (420). The speech recognition component (610) dynamically adjusts a beam width to decode a speech input.
(FR)
L'invention concerne un procédé consistant à sélectionner une largeur initiale de faisceau. Le procédé consiste aussi à déterminer si une valeur par trame change. Une largeur de faisceau est ajustée dynamiquement. Le procédé consiste en outre à décider d'une saisie vocale à l'aide de la largeur de faisceau ajustée dynamiquement. L'invention concerne aussi un dispositif comprenant un processeur (420). Un composant de reconnaissance vocale (610) et une mémoire (410) sont connectés au processeur (420). Le composant de reconnaissance vocale (610) ajuste dynamiquement une largeur de faisceau afin de décoder une saisie vocale.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international