此应用程序的某些内容目前无法使用。
如果这种情况持续存在,请联系我们反馈与联系
1. (WO2018106971) SYSTEM AND METHOD FOR NEURAL NETWORK BASED SPEAKER CLASSIFICATION
国际局存档的最新著录项目数据    提交意见

公布号: WO/2018/106971 国际申请号: PCT/US2017/065196
公布日: 14.06.2018 国际申请日: 07.12.2017
国际专利分类:
G10L 17/18 (2013.01) ,G10L 17/12 (2013.01) ,G10L 17/16 (2013.01)
G PHYSICS
10
乐器;声学
L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
17
讲话者辨认或验证
18
人工神经网络,连接方法
G PHYSICS
10
乐器;声学
L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
17
讲话者辨认或验证
06
决策方法,模式适配策略
12
记分标准化
G PHYSICS
10
乐器;声学
L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
17
讲话者辨认或验证
16
隐马尔科夫模型
申请人:
INTERACTIVE INTELLIGENCE GROUP, INC. [US/US]; 7601 Interactive Way Indianapolis, IN 46278, US
发明人:
GE, Zhenhao; US
IYER, Ananth, N.; US
CHELVARAJA, Srinath; US
SUNDARAM, Ram; GB
GANAPATHIRAJU, Aravind; US
代理人:
LEE, Shaun, P.; US
优先权数据:
62/431,12007.12.2016US
标题 (EN) SYSTEM AND METHOD FOR NEURAL NETWORK BASED SPEAKER CLASSIFICATION
(FR) SYSTÈME ET PROCÉDÉ DE CLASSIFICATION DE LOCUTEUR À BASE DE RÉSEAU NEURONAL
摘要:
(EN) A method for classifying speakers includes: receiving, by a speaker recognition system including a processor and memory, input audio including speech from a speaker; extracting, by the speaker recognition system, a plurality of speech frames containing voiced speech from the input audio; computing, by the speaker recognition system, a plurality of features for each of the speech frames of the input audio; computing, by the speaker recognition system, a plurality of recognition scores for the plurality of features; computing, by the speaker recognition system, a speaker classification result in accordance with the recognition scores; and outputting, by the speaker recognition system, the speaker classification result.
(FR) La présente invention concerne un procédé de classification de locuteurs qui comprend : la réception, par un système de reconnaissance de locuteur comprenant un processeur et une mémoire, d’une entrée audio comprenant une parole d’un locuteur ; l’extraction, par le système de reconnaissance de locuteur, d’une pluralité de trames de parole contenant de la parole vocale à partir de l’entrée audio ; le calcul, par le système de reconnaissance de locuteur, d’une pluralité de caractéristiques pour chacune des trames de parole de l’entrée audio ; le calcul, par le système de reconnaissance de locuteur, d’une pluralité de scores de reconnaissance pour la pluralité de caractéristiques ; le calcul, par le système de reconnaissance de locuteur, d’un résultat de classification de locuteur en fonction des scores de reconnaissance ; et la transmission, par le système de reconnaissance de locuteur, du résultat de classification de locuteur.
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
非洲地区知识产权组织 (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
欧亚专利局 (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧洲专利局 (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
非洲知识产权组织 (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
公布语言: 英语 (EN)
申请语言: 英语 (EN)