Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019047343) PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'EMPREINTE VOCALE, PROCÉDÉ, DISPOSITIF ET ÉQUIPEMENT DE RECONNAISSANCE VOCALE, ET SUPPORT
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/047343 N° de la demande internationale : PCT/CN2017/107829
Date de publication : 14.03.2019 Date de dépôt international : 26.10.2017
CIB :
G10L 17/04 (2013.01) ,G10L 17/14 (2013.01) ,G10L 17/02 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17
Identification ou vérification du locuteur
04
Entraînement, enrôlement ou construction de modèle
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17
Identification ou vérification du locuteur
06
Techniques de prise de décision; Stratégies d’alignement de motifs
14
Par catégorisation phonémique ou reconnaissance de la parole avant identification ou vérification du locuteur
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17
Identification ou vérification du locuteur
02
Opérations de prétraitement, p.ex. sélection de segment; Représentation ou modélisation de motifs, p.ex. fondée sur l’analyse linéaire discriminante [LDA] ou les composantes principales; Sélection ou extraction des caractéristiques
Déposants :
平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN/CN]; 中国广东省深圳市 福田区八卦岭八卦三路平安大厦 Ping An Building No. 3 Bagua. Road, Bagualing, Futian District Shenzhen, Guangdong 518000, CN
Inventeurs :
王健宗 WANG, Jianzong; CN
郭卉 GUO, Hui; CN
肖京 XIAO, Jing; CN
Mandataire :
深圳众鼎专利商标代理事务所(普通合伙) ZHONGDING INTELLECTUAL PROPERTY AGENCY; 中国广东省深圳市 龙岗区龙城街道中心城清林路546号城投商务中心4层/B Room B, 4F ChengTou Business Center No. 546 Qinglin Road, City Center Longcheng Street, Longgang District Shenzhen, Guangdong 518172, CN
Données relatives à la priorité :
201710811983.011.09.2017CN
Titre (EN) VOICEPRINT MODEL TRAINING METHOD, VOICE RECOGNITION METHOD, DEVICE AND EQUIPMENT AND MEDIUM
(FR) PROCÉDÉ D'APPRENTISSAGE DE MODÈLE D'EMPREINTE VOCALE, PROCÉDÉ, DISPOSITIF ET ÉQUIPEMENT DE RECONNAISSANCE VOCALE, ET SUPPORT
(ZH) 声纹模型训练方法、语音识别方法、装置、设备及介质
Abrégé :
(EN) A voiceprint model training method, a voice recognition method, device and equipment and a medium. The voiceprint model training method comprises: carrying out universal background model training by using training voice data in at least two service scenarios to obtain a universal background model (S11); carrying out feature extraction on intra-domain voice data and out-of-domain voice data by using the universal background model so as to obtain corresponding intra-domain voiceprint features and out-of-domain voiceprint features (S12); carrying out probability linear discriminant analysis model training on the basis of the out-of-domain voiceprint features to obtain an out-of-domain probability linear discriminant analysis model (S13); and adaptively training the out-of-domain probability linear discriminant analysis model on the basis of the intra-domain voiceprint features to obtain a target probability linear discriminant analysis model (S14). The described voiceprint model training method overcomes the problem of being unable to obtain multiple pieces of voice data of a single person in certain service scenarios, and ensures the recognition effect of the target probability linear discriminant analysis model.
(FR) L'invention concerne un procédé d'apprentissage de modèle d'empreinte vocale, un procédé, un dispositif et un équipement de reconnaissance vocale et un support. Le procédé d'apprentissage de modèle d'empreinte vocale comprend : la mise en œuvre d’un apprentissage de modèle du monde (UBM) au moyen de données vocales d'apprentissage dans au moins deux scénarios de service pour obtenir un modèle du monde (S11) ; la mise en œuvre d’une extraction de caractéristique sur des données vocales intra-domaine et sur des données vocales hors domaine au moyen du modèle du monde de façon à obtenir des caractéristiques d'empreinte vocale intra-domaine et des caractéristiques d'empreinte vocale hors domaine correspondantes (S12) ; la mise en œuvre d'un apprentissage de modèle d'analyse discriminante linéaire de probabilité sur la base des caractéristiques d'empreinte vocale hors domaine pour obtenir un modèle d'analyse discriminante linéaire de probabilité hors domaine (S13) ; et l’apprentissage adaptatif du modèle d'analyse discriminante linéaire de probabilité hors domaine sur la base des caractéristiques d'empreinte vocale intra-domaine pour obtenir un modèle d'analyse discriminante linéaire de probabilité cible (S14). Le procédé d'apprentissage de modèle d'empreinte vocale selon la présente invention résout le problème de l'incapacité à obtenir de multiples éléments de données vocales d'une seule personne dans certains scénarios de service, et assure l'effet de reconnaissance du modèle d'analyse discriminante linéaire de probabilité cible.
(ZH) 一种声纹模型训练方法、语音识别方法、装置、设备及介质。声学模型训练方法包括:采用至少两个业务场景下的训练语音数据进行通用背景模型训练,获取通用背景模型(S11);采用通用背景模型对域内语音数据和域外语音数据分别进行特征提取,获取相应的域内声纹特征和域外声纹特征(S12);基于域外声纹特征进行概率线性判别分析模型训练,获取域外概率线性判别分析模型(S13);基于域内声纹特征对域外概率线性判别分析模型进行自适应训练,获取目标概率线性判别分析模型(S14)。声纹模型训练方法克服了某些业务场景无法获得单人多通语音数据的问题,并保证目标概率线性判别分析模型的识别效果。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)