WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Options
Query Language
Stem
Sort by:
List Length
Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018024259) METHOD AND DEVICE FOR TRAINING VOICEPRINT RECOGNITION SYSTEM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/024259 International Application No.: PCT/CN2017/096232
Publication Date: 08.02.2018 International Filing Date: 07.08.2017
IPC:
G10L 17/02 (2013.01) ,G10L 17/04 (2013.01) ,G10L 17/14 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
02
Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
04
Training, enrolment or model building
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
06
Decision making techniques; Pattern matching strategies
14
Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
Applicants: TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED[CN/CN]; 35/F, Tencent Building Kejizhongyi Road, Midwest District of Hi-tech Park, Nanshan District Shenzhen, Guangdong 518057, CN
Inventors: LI, Wei; CN
QIAN, Binghua; CN
JIN, Xingming; CN
LI, Ke; CN
WU, Fuzhang; CN
WU, Yongjian; CN
HUANG, Feiyue; CN
Agent: BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.; A-1-102, He Jing Yuan, Ji Men Li, Xueyuan Road Haidian District Beijing 100088, CN
Priority Data:
201610639606.905.08.2016CN
Title (EN) METHOD AND DEVICE FOR TRAINING VOICEPRINT RECOGNITION SYSTEM
(FR) PROCÉDÉ ET DISPOSITIF DESTINÉS À UN SYSTÈME D’APPRENTISSAGE DE RECONNAISSANCE D'EMPREINTES VOCALES
(ZH) 训练声纹识别系统的方法和装置
Abstract:
(EN) A method and device for training a voiceprint recognition system and related to the field of voiceprint recognition technology. The method comprises: obtaining a voice training set (101); respectively determining identity vectors of voice segments in the voice training set (102); determining, from the determined identity vectors, identity vectors of multiple voice segments of a same user, for respective users (103); classifying the identity vectors of the same user identified from among multiple users into a user category from among multiple user categories (104); determining any one of the identity vectors in the user category to be a first identity vector (105); regularizing the first identity vector by means of a regular matrix (106); and training the regular matrix, and outputting a regular matrix training value when the regular matrix causes the sum of first values of each user category to be maximized (107). The method resolves the issue of a limited increase in the accuracy of voiceprint recognition employing identity vectors processed by linear discriminant analysis, enhancing the accuracy of voiceprint recognition.
(FR) L'invention concerne un procédé et un dispositif pour le système d'apprentissage de reconnaissance d'empreintes vocales, lesquels sont relatifs au domaine de la technologie de reconnaissance d'empreintes vocales. Le procédé consiste : à obtenir un ensemble d'apprentissage de reconnaissance vocale (101) ; à déterminer respectivement des vecteurs d'identité de segments vocaux dans l'ensemble d'apprentissage de reconnaissance vocale (102) ; à déterminer, à partir des vecteurs d'identité déterminés, des vecteurs d'identité des segments vocaux multiples d'un même utilisateur, pour des utilisateurs respectifs (103) ; à classer les vecteurs d'identité du même utilisateur, identifiés parmi les utilisateurs multiples, dans une catégorie d'utilisateur parmi des catégories d'utilisateurs multiples (104) ; à déterminer l'un des vecteurs d'identité dans la catégorie d'utilisateur en tant que premier vecteur d'identité (105) ; à régulariser le premier vecteur d'identité au moyen d'une matrice régulière (106) ; et à entraîner la matrice régulière et à sortir une valeur d'apprentissage de matrice régulière lorsque la matrice régulière amène la somme des premières valeurs de chaque catégorie d'utilisateur à être maximisée (107). Le problème décrit par l'invention porte sur une augmentation limitée de la précision de la reconnaissance d'empreintes vocales. La solution selon l'invention consiste à utiliser les vecteurs d'identité traités par analyse discriminatoire linéaire, ce qui améliore la précision de la reconnaissance d'empreintes vocales.
(ZH) 一种训练声纹识别系统的方法和装置,属于声纹识别技术领域,该方法包括:获取语音训练集合(101);分别确定出语音训练集合中每段语音的身份向量(102);在确定出的身份向量中,分别识别同一用户的多段语音的身份向量(103);分别将识别出的多个用户中的同一用户的身份向量划分为多个用户类别中的一个用户类别中(104);确定用户类别内的任一身份向量为第一身份向量(105);通过规整矩阵规整第一身份向量(106);训练规整矩阵,当规整矩阵使得每一用户类别的第一数值的总和最大化时,输出规整矩阵训练值(107)。该方法解决了利用经过线性区分分析处理后的身份向量进行声纹识别准确率的提高程度低的问题,提高了声纹识别的准确率。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)