Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2003105124 - RESEAU DE MICROPHONES A DISCRIMINATION DE LA SOURCE EN TEMPS-FREQUENCE

Numéro de publication WO/2003/105124
Date de publication 18.12.2003
N° de la demande internationale PCT/US2003/018189
Date du dépôt international 09.06.2003
CIB
G10L 15/20 2006.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
20Techniques de reconnaissance de la parole spécialement adaptées de par leur robustesse contre les perturbations environnantes, p.ex. en milieu bruyant ou reconnaissance de la parole émise dans une situation de stress
G10L 21/02 2006.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
21Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
02Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho
CPC
G10L 15/20
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
G10L 2021/02166
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0208Noise filtering
0216characterised by the method used for estimating noise
02161Number of inputs available containing the signal or the noise to be suppressed
02166Microphone arrays; Beamforming
G10L 21/0272
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0272Voice signal separating
Déposants
  • SONY ELECTRONICS INC. [US]/[US]
Inventeurs
  • ALMSTRAND, Lars C.
  • KONOPKA, Courtney
Mandataires
  • ROGITZ, John L.
Données relatives à la priorité
60/388,12311.06.2002US
Langue de publication Anglais (en)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) MICROPHONE ARRAY WITH TIME-FREQUENCY SOURCE DISCRIMINATION
(FR) RESEAU DE MICROPHONES A DISCRIMINATION DE LA SOURCE EN TEMPS-FREQUENCE
Abrégé
(EN) A 3D microphone array (10) is provided fro, e.g., sending sound to a speech recognition (SR) engine (46). To increase SNR while minimizing the compulational load on the SR engine (46), the array processor (40) compares received time-frequency profiles from various sources (18, 26, 30, 34) of sound to a model hypothesis provided by the SR engine (46) (46), and sends on to the SR engine (46) (46) only those profiles that are similar to the model hypothesis. If desired, sources of sound can also be discriminated against on the basis of energy level and spatial location within a room.
(FR) La présente invention concerne un réseau (10) de microphones 3D qui est prévu, par exemple, pour envoyer des sons à un moteur (46) de reconnaissance de la parole (RP). Pour améliorer le rapport signal sur bruit tout en réduisant au maximum la charge de calcul incombant au moteur (RP) (46), le processeur (40) du réseau compare les profils de temps-fréquence reçus en provenance de diverses sources (18, 26, 30, 34) de son à un modèle d'hypothèse produit par le moteur RP (46) et envoie au moteur (RP) uniquement les profils qui sont similaires au modèle d'hypothèse. Si nécessaire, les sources de son peuvent également être distinguées les unes des autres sur la base du niveau d'énergie et de leur position spatiale à l'intérieur d'une pièce.
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international