Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019047703) AUDIO EVENT DETECTION METHOD AND DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/047703 International Application No.: PCT/CN2018/100939
Publication Date: 14.03.2019 International Filing Date: 17.08.2018
IPC:
G10L 15/06 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15
Speech recognition
06
Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Applicants:
腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; 中国广东省深圳市 南山区高新区科技中一路腾讯大厦35层 35/F, Tencent Building, Kejizhongyi Road, Midwest District of Hi-tech park Nanshan District Shenzhen, Guangdong 518057, CN
Inventors:
刘海波 LIU, Haibo; CN
Agent:
北京德琦知识产权代理有限公司 DEQI INTELLECTUAL PROPERTY LAW CORPORATION; 中国北京市 海淀区知春路1号学院国际大厦7层 7/F, Xueyuan International Tower Haidian District, No. 1 Zhichun Road Beijing 100083, CN
Priority Data:
201710797265.206.09.2017CN
Title (EN) AUDIO EVENT DETECTION METHOD AND DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF DE DÉTECTION D'ÉVÉNEMENT AUDIO ET SUPPORT DE STOCKAGE LISIBLE PAR ORDINATEUR
(ZH) 音频事件检测方法、装置及计算机可读存储介质
Abstract:
(EN) Provided are an audio event detection method and device, and a computer-readable storage medium, the method comprising: performing framing processing on an audio to be checked to obtain audio data of each time period in the audio to be checked, and respectively extracting a specified feature vector from the audio data of each time period (401); inputting the specified feature vector of the audio data of each time period to a unidirectional or bidirectional recurrent neural network (RNN/BI-RNN) model obtained by means of training to obtain the posterior probability of each pre-set audio event in the audio data of each time period (402); and with respect to each time period, according to the posterior probability of each audio event in the audio data of the time period and a pre-set audio decoding algorithm, obtaining a target audio event of the audio data of the time period, and with respect to the target audio event of any time period, extracting the optimal audio data sequence of the target audio event from the audio data of each time period (403).
(FR) L'invention concerne un procédé et un dispositif de détection d'événement audio, ainsi qu’un support de stockage lisible par ordinateur, ledit procédé consistant à : effectuer un traitement de cadrage sur une fréquence audio à détecter afin d’obtenir les données audio de chaque période dans la fréquence audio à détecter, puis extraire respectivement un vecteur de caractéristiques spécifié à partir des données audio de chaque période (401) ; entrer le vecteur de caractéristiques spécifié des données audio de chaque période dans un modèle de réseau neuronal récurrent unidirectionnel ou bidirectionnel (RNN/BI-RNN) obtenu par apprentissage afin d’obtenir la probabilité postérieure de chaque événement audio prédéfini dans les données audio de chaque période (402) ; et par rapport à chaque période, en fonction de la probabilité postérieure de chaque événement audio dans les données audio de la période et d'un algorithme de décodage audio prédéfini, obtenir un événement audio cible des données audio de la période et, par rapport à l'événement audio cible de n'importe quelle période, extraire la séquence de données audio optimale de l'événement audio cible à partir des données audio de chaque période (403).
(ZH) 一种音频事件检测方法、装置及计算机可读存储介质,方法包括:对待检测的音频进行分帧处理得到待检测的音频中各时间段的音频数据,从各时间段的音频数据中分别提取指定特征向量(401);将各时间段的音频数据的指定特征向量输入训练得到的单向或双向循环神经网络RNN/BI-RNN模型中,得到预设的各音频事件在各时间段的音频数据中的后验概率(402);针对每个时间段,根据时间段的音频数据中各音频事件的后验概率及预置的音频解码算法得到时间段的音频数据的目标音频事件;针对任一时间段的目标音频事件,从各时间段的音频数据中提取出目标音频事件的最佳音频数据序列(403)。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)