Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019047343) VOICEPRINT MODEL TRAINING METHOD, VOICE RECOGNITION METHOD, DEVICE AND EQUIPMENT AND MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/047343 International Application No.: PCT/CN2017/107829
Publication Date: 14.03.2019 International Filing Date: 26.10.2017
IPC:
G10L 17/04 (2013.01) ,G10L 17/14 (2013.01) ,G10L 17/02 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
04
Training, enrolment or model building
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
06
Decision making techniques; Pattern matching strategies
14
Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
02
Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Applicants:
平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN/CN]; 中国广东省深圳市 福田区八卦岭八卦三路平安大厦 Ping An Building No. 3 Bagua. Road, Bagualing, Futian District Shenzhen, Guangdong 518000, CN
Inventors:
王健宗 WANG, Jianzong; CN
郭卉 GUO, Hui; CN
肖京 XIAO, Jing; CN
Agent:
深圳众鼎专利商标代理事务所(普通合伙) ZHONGDING INTELLECTUAL PROPERTY AGENCY; 中国广东省深圳市 龙岗区龙城街道中心城清林路546号城投商务中心4层/B Room B, 4F ChengTou Business Center No. 546 Qinglin Road, City Center Longcheng Street, Longgang District Shenzhen, Guangdong 518172, CN
Priority Data:
201710811983.011.09.2017CN
Title (EN) VOICEPRINT MODEL TRAINING METHOD, VOICE RECOGNITION METHOD, DEVICE AND EQUIPMENT AND MEDIUM
(FR) PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'EMPREINTE VOCALE, PROCÉDÉ, DISPOSITIF ET ÉQUIPEMENT DE RECONNAISSANCE VOCALE, ET SUPPORT
(ZH) 声纹模型训练方法、语音识别方法、装置、设备及介质
Abstract:
(EN) A voiceprint model training method, a voice recognition method, device and equipment and a medium. The voiceprint model training method comprises: carrying out universal background model training by using training voice data in at least two service scenarios to obtain a universal background model (S11); carrying out feature extraction on intra-domain voice data and out-of-domain voice data by using the universal background model so as to obtain corresponding intra-domain voiceprint features and out-of-domain voiceprint features (S12); carrying out probability linear discriminant analysis model training on the basis of the out-of-domain voiceprint features to obtain an out-of-domain probability linear discriminant analysis model (S13); and adaptively training the out-of-domain probability linear discriminant analysis model on the basis of the intra-domain voiceprint features to obtain a target probability linear discriminant analysis model (S14). The described voiceprint model training method overcomes the problem of being unable to obtain multiple pieces of voice data of a single person in certain service scenarios, and ensures the recognition effect of the target probability linear discriminant analysis model.
(FR) L'invention concerne un procédé d'apprentissage de modèle d'empreinte vocale, un procédé, un dispositif et un équipement de reconnaissance vocale et un support. Le procédé d'apprentissage de modèle d'empreinte vocale comprend : la mise en œuvre d’un apprentissage de modèle du monde (UBM) au moyen de données vocales d'apprentissage dans au moins deux scénarios de service pour obtenir un modèle du monde (S11) ; la mise en œuvre d’une extraction de caractéristique sur des données vocales intra-domaine et sur des données vocales hors domaine au moyen du modèle du monde de façon à obtenir des caractéristiques d'empreinte vocale intra-domaine et des caractéristiques d'empreinte vocale hors domaine correspondantes (S12) ; la mise en œuvre d'un apprentissage de modèle d'analyse discriminante linéaire de probabilité sur la base des caractéristiques d'empreinte vocale hors domaine pour obtenir un modèle d'analyse discriminante linéaire de probabilité hors domaine (S13) ; et l’apprentissage adaptatif du modèle d'analyse discriminante linéaire de probabilité hors domaine sur la base des caractéristiques d'empreinte vocale intra-domaine pour obtenir un modèle d'analyse discriminante linéaire de probabilité cible (S14). Le procédé d'apprentissage de modèle d'empreinte vocale selon la présente invention résout le problème de l'incapacité à obtenir de multiples éléments de données vocales d'une seule personne dans certains scénarios de service, et assure l'effet de reconnaissance du modèle d'analyse discriminante linéaire de probabilité cible.
(ZH) 一种声纹模型训练方法、语音识别方法、装置、设备及介质。声学模型训练方法包括:采用至少两个业务场景下的训练语音数据进行通用背景模型训练,获取通用背景模型(S11);采用通用背景模型对域内语音数据和域外语音数据分别进行特征提取,获取相应的域内声纹特征和域外声纹特征(S12);基于域外声纹特征进行概率线性判别分析模型训练,获取域外概率线性判别分析模型(S13);基于域内声纹特征对域外概率线性判别分析模型进行自适应训练,获取目标概率线性判别分析模型(S14)。声纹模型训练方法克服了某些业务场景无法获得单人多通语音数据的问题,并保证目标概率线性判别分析模型的识别效果。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)