Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019062721) TRAINING METHOD FOR VOICE IDENTITY FEATURE EXTRACTOR AND CLASSIFIER AND RELATED DEVICES
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/062721 International Application No.: PCT/CN2018/107385
Publication Date: 04.04.2019 International Filing Date: 25.09.2018
IPC:
G10L 17/02 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
02
Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Applicants:
腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; 中国广东省深圳市 南山区高新区科技中一路腾讯大厦35层 35/F, Tencent Building Kejizhongyi Road, Midwest District of Hi-tech Park, Nanshan District Shenzhen, Guangdong 518057, CN
Inventors:
李娜 LI, Na; CN
王珺 WANG, Jun; CN
Agent:
深圳市深佳知识产权代理事务所(普通合伙) SHENPAT INTELLECTUAL PROPERTY AGENCY; 中国广东省深圳市 国贸大厦15楼西座1521室 Room 1521 West Block, Guomao Building Shenzhen, Guangdong 518014, CN
Priority Data:
201710910880.X29.09.2017CN
Title (EN) TRAINING METHOD FOR VOICE IDENTITY FEATURE EXTRACTOR AND CLASSIFIER AND RELATED DEVICES
(FR) PROCÉDÉ D'APPRENTISSAGE POUR EXTRACTEUR ET CLASSIFICATEUR DE CARACTÉRISTIQUES D'IDENTITÉ VOCALE, ET DISPOSITIFS ASSOCIÉS
(ZH) 语音身份特征提取器、分类器训练方法及相关设备
Abstract:
(EN) Disclosed are a training method for a voice identity feature extractor and classifier, and related devices. The training method for a voice identity feature extractor comprises: extracting voice feature vectors of a training voice (S100); determining a corresponding I-vector according to the voice feature vectors of the training voice (S110); using the I-vector as a first target output of a neural network model to adjust a weight of the neural network model so as to obtain a first neural network model (S120); obtaining voice feature vectors of a target detecting voice and determining an output result of the first neural network model for the voice feature vectors of the target detecting voice (S130); determining identity factor hidden variables according to the output result (S140); and estimating a posterior mean of the identity factor hidden variables and using the posterior mean as a second target output of the first neural network model to adjust a weight of the first neural network model so as to obtain a voice identity feature extractor (S150).
(FR) L'invention concerne un procédé d'apprentissage pour un extracteur et un classificateur de caractéristiques d'identité vocale, et des dispositifs associés. Le procédé d'apprentissage pour un extracteur de caractéristiques d'identité vocale comprend : l’extraction de vecteurs de caractéristiques vocales d'une voix d'apprentissage (S100) ; la détermination d’un vecteur I correspondant en fonction des vecteurs de caractéristiques vocales de la voix d'apprentissage (S110) ; l’utilisation du vecteur I comme première sortie cible d'un modèle de réseau neuronal pour régler un poids du modèle de réseau neuronal afin d'obtenir un premier modèle de réseau neuronal (S120) ; l’obtention des vecteurs de caractéristiques vocales d'une voix de détection cible et la détermination d’un résultat de sortie du premier modèle de réseau neuronal pour les vecteurs de caractéristiques vocales de la voix de détection cible (S130) ; la détermination de variables cachées de facteur d'identité en fonction du résultat de sortie (S140) ; et l’estimation d’une moyenne corrigée des variables cachées de facteur d'identité et l’utilisation de la moyenne corrigée comme seconde sortie cible du premier modèle de réseau neuronal pour régler un poids du premier modèle de réseau neuronal afin d'obtenir un extracteur de caractéristiques d'identité vocale (S150).
(ZH) 一种语音身份特征提取器、分类器训练方法及相关设备。语音身份特征提取器训练方法包括:提取训练语音的语音特征向量(S100);根据训练语音的语音特征向量,确定相应的I-vector(S110);以I-vector作为神经网络模型的第一目标输出,对神经网络模型的权重进行调整,得到第一神经网络模型(S120);获取目标检测语音的语音特征向量,确定第一神经网络模型对目标检测语音的语音特征向量的输出结果(S130);根据输出结果,确定身份因子隐变量(S140);估计身份因子隐变量的后验均值,以后验均值作为第一神经网络模型的第二目标输出,调整第一神经网络模型的权重,得到语音身份特征提取器(S150)。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)