WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018025024) RECONNAISSANCE DE LOCUTEUR
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2018/025024    N° de la demande internationale :    PCT/GB2017/052233
Date de publication : 08.02.2018 Date de dépôt international : 01.08.2017
CIB :
G10L 17/02 (2013.01)
Déposants : CIRRUS LOGIC INTERNATIONAL SEMICONDUCTOR LIMITED [GB/GB]; 7B Nightingale Way, Quartermile Edinburgh EH3 9EG (GB)
Inventeurs : LESSO, John Paul; (GB).
MELANSON, John; (US)
Mandataire : DAVIES, Philip; (GB)
Données relatives à la priorité :
62/370,408 03.08.2016 US
1622191.3 23.12.2016 GB
Titre (EN) SPEAKER RECOGNITION
(FR) RECONNAISSANCE DE LOCUTEUR
Abrégé : front page image
(EN)This application describes methods and apparatus for speaker recognition. An apparatus according to an embodiment has an analyzer (202) for analyzing each frame of a sequence of frames of audio data (AIN) which correspond to speech sounds uttered by a user to determine at least one characteristic of the speech sound of that frame. An assessment module (203) determines, for each frame of audio data, a contribution indicator of the extent to which the frame of audio data should be used for speaker recognition processing based on the determined characteristic of the speech sound. In this way frames which correspond to speech sounds that are of most use for speaker discrimination may be emphasized and/or frames which correspond to speech sounds that are of least use for speaker discrimination may be de-emphasized.
(FR)La présente invention concerne des procédés et un appareil de reconnaissance de locuteur. Un appareil selon un mode de réalisation de la présente invention comporte un analyseur (202) pour analyser chaque trame d’une séquence de trames de données audio (AIN) qui correspondent aux sons vocaux prononcés par un utilisateur pour déterminer au moins une caractéristique du son vocal de cette trame. Un module d’évaluation (203) détermine, pour chaque trame de données audio, un indicateur de contribution du degré auquel la trame de données audio devrait être utilisée pour un traitement de reconnaissance de locuteur sur la base des caractéristiques déterminées du son vocal. De cette manière, les trames qui correspondent à des sons vocaux qui sont les plus utiles pour la discrimination de locuteur peuvent être soulignées et/ou les trames qui correspondent aux sons vocaux qui sont les moins utiles pour la discrimination de locuteur peuvent être désoulignées.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)