WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2002090915) ENTRAINEMENT EN FOND DE VOIX DE LOCUTEURS
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2002/090915    N° de la demande internationale :    PCT/IB2002/001495
Date de publication : 14.11.2002 Date de dépôt international : 25.04.2002
CIB :
G10L 15/06 (2006.01), G10L 17/00 (2006.01)
Déposants : KONINKLIJKE PHILIPS ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1, NL-5621 BA Eindhoven (NL)
Inventeurs : HUANG, Chao-Shih; (NL).
CHU, Ya-Cherng; (NL).
TSAI, Wei-Ho; (NL).
CHENG, Jyh-Min; (NL)
Mandataire : GÖSSMANN, Klemens; Internationaal Octrooibureau B.V., Prof. Holstlaan 6, NL-5656 AA Eindhoven (NL)
Données relatives à la priorité :
01201720.8 10.05.2001 EP
Titre (EN) BACKGROUND LEARNING OF SPEAKER VOICES
(FR) ENTRAINEMENT EN FOND DE VOIX DE LOCUTEURS
Abrégé : front page image
(EN)A speaker identification system includes a speaker model generator 110 for generating a plurality of speaker models. To this end, the generator records training utterances from a plurality of speakers in the background, without prior knowledge of the speakers who spoke the utterances. The generator performs a blind clustering of the training utterances based on a predetermined criterion. For each of the clusters a corresponding speaker model is trained. A speaker identifier 130 identifies a speaker determining a most likely one of the speaker models for an utterance received from the speaker. The speaker associated with the most likely speaker model is identified as the speaker of the test utterance.
(FR)L'invention concerne un système d'identification de locuteur comprenant un générateur de modèle de locuteur (110) permettant de générer une pluralité de modèles de locuteurs. A cet effet, le générateur enregistre en fond des énoncés d'entraînement de plusieurs locuteurs, sans savoir préalablement quels sont les locuteurs qui disent les énoncés. Le générateur réalise un groupage aveugle des énoncés d'entraînement sur la base d'un critère prédéterminé. Pour chaque groupe, il y a entraînement d'un modèle de locuteur correspondant. Un identificateur de locuteur (130) identifie un locuteur déterminant le modèle de locuteur le plus vraisemblable d'un énoncé reçu du locuteur. Le locuteur associé au modèle de locuteur le plus probable est identifié comme le locuteur de l'énoncé test.
États désignés : CN, JP.
Office européen des brevets (OEB) (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)