WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017166651) VOICE RECOGNITION MODEL TRAINING METHOD, SPEAKER TYPE RECOGNITION METHOD AND DEVICE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/166651    International Application No.:    PCT/CN2016/096986
Publication Date: 05.10.2017 International Filing Date: 26.08.2016
IPC:
G10L 15/02 (2006.01), G10L 15/07 (2013.01)
Applicants: LE HOLDINGS (BEIJING) CO., LTD. [CN/CN]; Room 1102,10 Layer,Building 3, No.105 Yaojiayuan Road, ChaoYang District Beijing 100025 (CN).
LE SHI ZHI XIN ELECTRONIC TECHNOLOGY (TIANJIN) LIMITED [CN/CN]; 201-427 2nd floor, B1 Dongman Building NO.126 Dongman Middle Road, Eco-City, Binhai New Area Tianjin 300467 (CN)
Inventors: ZHANG, Junbo; (CN)
Agent: CHINABLE IP; 620 Room, 35-10-2, the 6th floor No.35 Anding Road, Chaoyang District Beijing 100029 (CN)
Priority Data:
201610195561.0 30.03.2016 CN
Title (EN) VOICE RECOGNITION MODEL TRAINING METHOD, SPEAKER TYPE RECOGNITION METHOD AND DEVICE
(FR) PROCÉDÉ D'APPRENTISSAGE DE MODÈLE DE RECONNAISSANCE VOCALE, PROCÉDÉ ET DISPOSITIF DE RECONNAISSANCE DE TYPE D'ORATEUR
(ZH) 语音识别模型训练方法、说话人类型识别方法及装置
Abstract: front page image
(EN)A voice recognition model training method, a speaker type recognition method and device. The method comprises: acquiring a training voice and extracting an acoustic characteristic of the training voice (101); using the acoustic characteristic to train a characteristic recognizer for extracting a speaker characteristic (102); using the characteristic recognizer to extract, from a target voice corresponding to each user type, the speaker characteristic to serve as a speaker characteristic corresponding to the user type (103); and taking speaker characteristics corresponding to different user types and the feature recognizer as a speaker type recognition model (104). A speaker characteristic of the voice to be recognized is extracted, by combining the feature recognizer in the speaker type recognition model with the acoustic characteristic of the voice to be recognized; the speaker characteristic of the voice to be recognized matches the speaker characteristics corresponding to different user types; and the user type corresponding to the speaker characteristic with the highest matching degree is recognized as a user type of the voice to be recognized.
(FR)L'invention concerne un procédé d'apprentissage de modèle de reconnaissance vocale, un procédé et un dispositif de reconnaissance de type d'orateur. Le procédé consiste à : acquérir une voix d'apprentissage et extraire une caractéristique acoustique de la voix d'apprentissage (101) ; utiliser la caractéristique acoustique pour apprendre à un dispositif de reconnaissance de caractéristique à extraire une caractéristique d'orateur (102) ; utiliser le dispositif de reconnaissance de caractéristique pour extraire, à partir d'une voix cible correspondant à chaque type d'utilisateur, la caractéristique d'orateur pour servir de caractéristique d'orateur correspondant au type d'utilisateur (103) ; et prendre des caractéristiques d'orateur correspondant à différents types d'utilisateur et au dispositif de reconnaissance de caractéristique comme modèle de reconnaissance de type d'orateur (104). Une caractéristique d'orateur de la voix à reconnaître est extraite, en combinant le dispositif de reconnaissance de caractéristique dans le modèle de reconnaissance de type d'orateur à la caractéristique acoustique de la voix à reconnaître ; la caractéristique d'orateur de la voix à reconnaître correspond aux caractéristiques d'orateur correspondant à différents types d'utilisateur ; et le type d'utilisateur correspondant à la caractéristique d'orateur ayant le degré de correspondance le plus élevé est reconnu comme type d'utilisateur de la voix à reconnaître.
(ZH)一种语音识别模型训练方法、说话人类型识别方法及装置,获取训练语音并提取所述训练语音的声学特征(101);利用所述声学特征,训练获得用于提取说话人特征的特征识别器(102);利用所述特征识别器从每一个用户类型对应的目标语音中提取说话人特征,作为所述用户类型对应的说话人特征(103);将不同用户类型对应的说话人特征以及所述特征识别器,作为说话人类型识别模型(104)。利用说话人类型识别模型中所述特征识别器结合待识别语音的声音特征,提取所述待识别语音的说话人特征,并将所述待识别语音的说话人特征与不同用户类型对应的说话人特征进行匹配,将匹配度最高的说话人特征对应的用户类型识别为所述待识别语音的用户类型。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)