WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014008843) PROCÉDÉ DE MISE À JOUR DE MODÈLE DE CARACTÉRISTIQUES D'EMPREINTE VOCALE ET TERMINAL
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/008843    N° de la demande internationale :    PCT/CN2013/079005
Date de publication : 16.01.2014 Date de dépôt international : 08.07.2013
CIB :
G10L 15/02 (2006.01), G10L 17/04 (2013.01)
Déposants : HUAWEI DEVICE CO., LTD. [CN/CN]; Building B2, Huawei Industrial Base, Bantian, Longgang Shenzhen, Guangdong 518129 (CN)
Inventeurs : LU, Ting; (CN)
Données relatives à la priorité :
201210235593.0 09.07.2012 CN
Titre (EN) METHOD FOR UPDATING VOICEPRINT FEATURE MODEL AND TERMINAL
(FR) PROCÉDÉ DE MISE À JOUR DE MODÈLE DE CARACTÉRISTIQUES D'EMPREINTE VOCALE ET TERMINAL
(ZH) 一种声纹特征模型更新方法及终端
Abrégé : front page image
(EN)A method for updating a voiceprint feature model and a terminal. The method comprises: obtaining an original audio stream comprising at least one speaker (S101); obtaining the respective audio stream of each speaker in the at least one speaker in the original audio stream according to a preset speaker segmentation and clustering algorithm (S102); matching the respective audio stream of each speaker in the at least one speaker with an original voiceprint feature model, so as to obtain the successfully-matched audio stream (S103); and using the successfully-matched audio stream as an additional audio stream training sample used for generating the original voiceprint feature model, and updating the original voiceprint feature model (S104). According to the present invention, the valid audio stream during a conversation process is adaptively extracted and used as the additional audio stream training sample, and the additional audio stream training sample is used for dynamically correcting the original voiceprint feature model, thus achieving a purpose of improving the precision of the voiceprint feature model and the accuracy of recognition under the premise of high practicability.
(FR)L'invention porte sur un procédé de mise à jour d'un modèle de caractéristiques d'empreinte vocale et sur un terminal. Le procédé consiste à : obtenir un flux audio original comprenant au moins un locuteur (S101); obtenir le flux audio respectif de chaque locuteur parmi le ou les locuteurs dans le flux audio original conformément à un algorithme de segmentation et regroupement en locuteurs prédéfini (S102); apparier le flux audio respectif de chaque locuteur parmi le ou les locuteurs à un modèle de caractéristiques d'empreinte vocale original, de manière à obtenir le flux audio apparié avec succès (S103); et utiliser le flux audio apparié avec succès comme échantillon d'apprentissage de flux audio supplémentaire utilisé pour générer le modèle de caractéristiques d'empreinte vocale original, et mettre à jour le modèle de caractéristiques d'empreinte vocale original (S104). Selon la présente invention, le flux audio valide durant un processus de conversation est extrait d'une manière adaptative et utilisé comme échantillon d'apprentissage de flux audio supplémentaire, et l'échantillon d'apprentissage de flux audio supplémentaire est utilisé pour corriger dynamiquement le modèle de caractéristiques d'empreinte vocale original, atteignant ainsi le but d'améliorer la précision du modèle de caractéristiques d'empreinte vocale et la précision de reconnaissance sous la prémisse d'une haute praticabilité.
(ZH)一种声纹特征模型更新方法及终端,所述方法包括:获取包含至少一个说话者的原始音频流(S101);根据预设的说话人分割与聚类算法,获取所述原始音频流中所述至少一个说话者中每一个说话者的分别的音频流(S102);将所述至少一个说话者中每一个说话者的分别的音频流分别与原始声纹特征模型进行匹配,获取匹配成功的音频流(S103);将所述匹配成功的音频流作为生成所述原始声纹特征模型的追加音频流训练样本,对所述原始声纹特征模型进行更新(S104)。通过自适应提取通话过程中的有效音频流作为追加的音频流训练样本,用于动态修正原有的声纹特征模型,达到了在保证较高的实用性的前提下,提高声纹特征模型精确度及识别准确率的目的。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)