WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2000052683) DETECTION DE LA PAROLE A L'AIDE DE MESURES DE CONFIANCE STOCHASTIQUES SUR LE SPECTRE DE FREQUENCE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2000/052683    N° de la demande internationale :    PCT/US2000/001798
Date de publication : 08.09.2000 Date de dépôt international : 25.01.2000
Demande présentée en vertu du Chapitre 2 :    29.08.2000    
CIB :
G10L 11/02 (2006.01)
Déposants : PANASONIC TECHNOLOGIES, INC. [US/US]; Two Research Way, 3rd floor, Princeton, NJ 08540 (US)
Inventeurs : GELIN, Philippe; (US).
JUNQUA, Jean-Claude; (US)
Mandataire : STOBBS, Gregory, A.; Harness, Dickey & Pierce, P.L.C., P.O. Box 828, Bloomfield Hills, MI 48303 (US)
Données relatives à la priorité :
09/263,292 05.03.1999 US
Titre (EN) SPEECH DETECTION USING STOCHASTIC CONFIDENCE MEASURES ON THE FREQUENCY SPECTRUM
(FR) DETECTION DE LA PAROLE A L'AIDE DE MESURES DE CONFIANCE STOCHASTIQUES SUR LE SPECTRE DE FREQUENCE
Abrégé : front page image
(EN)A probabilistic approach is used to classify each frame of the speech signal as speech or non-speech. The speech detection method is based on a frequency spectrum (24) extracted from each frame, such that the value for each frequency band is considered to be a random variable and each frame is considered to be an occurrence of these random variables. Using the frequency spectrums from a non-speech part of the speech signal, a known set of random variables is constructed (26). Next, each unknown frame is evaluated as to whether or not it belongs to this set of random variables by forming a unique random variable (preferably a chi-square value) (28) from a set of random variables associated with the unknown frame. The unique variable is normalized (30) with respect the known set, and then classified (32) as either speech or non-speech using the 'Test of Hypothesis'. Thus, each frame that belongs to the known set of random variables is classified as non-speech, and each frame that does not belong to the known set of random variables is classified as speech.
(FR)On utilise une approche probabilistique pour classifier chaque trame du signal vocal comme étant vocal ou non vocal. Le procédé de détection de parole est basé sur un spectre (24) de fréquences extrait de chaque trame, de manière que la valeur de chaque bande de fréquences soit considérée comme étant une variable aléatoire et que chaque trame soit considérée comme étant une occurrence de ces variables aléatoires. A l'aide des spectres de fréquences tirés de la partie non vocale du signal vocal, un ensemble connu de variables aléatoires est construit (26). Ensuite, chaque trame inconnue est évaluée afin de savoir si oui ou non elle appartient à cet ensemble de variables aléatoires par formation d'une variable aléatoire unique (de préférence une valeur khi-carré) (28) à partir d'un ensemble de variables aléatoires associées à la trame inconnue. La variable unique est normalisée (30) par rapport à l'ensemble connu, et ensuite elle est classifiée (32) comme étant vocale ou non vocale, à l'aide du 'test d'hypothèse'. Ainsi, chaque trame appartenant à l'ensemble connu de variables aléatoires est classifiée comme étant non vocale, et chaque trame n'appartenant pas à l'ensemble connu de variables aléatoires est classifiée comme étant vocale.
États désignés : JP.
Office européen des brevets (OEB) (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)