Processing

Please wait...

Settings

Settings

1. WO2020001182 - VOICEPRINT RECOGNITION METHOD, ELECTRONIC DEVICE, AND COMPUTER READABLE STORAGE MEDIUM

Publication Number WO/2020/001182
Publication Date 02.01.2020
International Application No. PCT/CN2019/086767
International Filing Date 14.05.2019
IPC
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
06
Decision making techniques; Pattern matching strategies
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25
Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
03
characterised by the type of extracted parameters
24
the extracted parameters being the cepstrum
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25
Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
48
specially adapted for particular use
51
for comparison or discrimination
G10L 17/06 (2013.01)
G10L 25/24 (2013.01)
G10L 25/51 (2013.01)
CPC
G10L 17/06
G10L 25/24
G10L 25/51
Applicants
  • 深圳大学 SHENZHEN UNIVERSITY [CN/CN]; 中国广东省深圳市 南山区南海大道3688号 No.3688 Nanhai Road, Nanshan Shenzhen, Guangdong 518060, CN
Inventors
  • 郑能恒 ZHENG, Nengheng; CN
  • 林吉 LIN, Ji; CN
Agents
  • 深圳市恒申知识产权事务所(普通合伙) HENSEN INTELLECTUAL PROPERTY FIRM; 中国广东省深圳市 福田区南园路68号上步大厦10H 10H Shangbu Building No. 68 Nanyuan Road, Futian Shenzhen, Guangdong 518000, CN
Priority Data
201810688682.828.06.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) VOICEPRINT RECOGNITION METHOD, ELECTRONIC DEVICE, AND COMPUTER READABLE STORAGE MEDIUM
(FR) PROCÉDÉ DE RECONNAISSANCE D'EMPREINTE VOCALE, DISPOSITIF ÉLECTRONIQUE ET SUPPORT DE STOCKAGE LISIBLE PAR ORDINATEUR
(ZH) 声纹识别方法、电子装置及计算机可读存储介质
Abstract
(EN)
A voiceprint recognition method, an electronic device, and a computer readable storage medium. The voiceprint recognition method comprises: acquiring voice data to be analyzed; extracting a change factor feature in the voice data; using an fallible point classifier to perform miscalculation classification on the voice data according to the change factor feature so as to obtain relative miscalculation probabilities of voice data miscalculation in K subsystems; determining the offset of the relative miscalculation probability corresponding to any subsystem with respect to the average relative miscalculation probability of the K subsystems, and calculating a final fusion weight of the corresponding subsystem according to the offset; and weighting the recognition result of each subsystem by means of the final fusion weight, and obtaining a comprehensive recognition result of the voice data according to the recognition result of each subsystem after weighting.
(FR)
La présente invention concerne un procédé de reconnaissance d'empreinte vocale, un dispositif électronique et un support de stockage lisible par ordinateur. Le procédé de reconnaissance d'empreinte vocale comprend les étapes consistant à : acquérir des données vocales devant être analysées; extraire une caractéristique d'un facteur de changement dans les données vocales; utiliser un classificateur de points faillibles pour effectuer une classification d'erreurs de calcul sur les données vocales en fonction de la caractéristique du facteur de changement de façon à obtenir des probabilités d'erreur de calcul relatives d'une erreur de calcul des données vocales dans K sous-systèmes; déterminer le décalage de la probabilité d'erreur de calcul relative correspondant à un quelconque sous-système par rapport à la probabilité d'erreur de calcul relative moyenne des K sous-systèmes puis calculer une pondération de fusion finale du sous-système correspondant en fonction du décalage; pondérer le résultat de reconnaissance de chaque sous-système au moyen de la pondération de fusion finale et obtenir un résultat de reconnaissance complet des données vocales en fonction du résultat de reconnaissance de chaque sous-système après pondération.
(ZH)
一种声纹识别方法、电子装置及计算机可读存储介质,其中,该声纹识别方法包括:获取待分析的语音数据;提取所述语音数据中的变化因子特征,通过易错点分类器,根据所述变化因子特征对所述语音数据进行误判分类,得到所述语音数据在所述K个子系统中被误判的相对误判概率;确定任一子系统对应的相对误判概率与所述K个子系统的平均相对误判概率的偏置量,并根据所述偏置量计算相应子系统的最终融合权重;通过所述最终融合权重对相应的各个子系统的识别结果进行加权,根据加权后各个子系统的识别结果得到所述语音数据的综合识别结果。
Latest bibliographic data on file with the International Bureau