Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019047703) PROCÉDÉ ET DISPOSITIF DE DÉTECTION D'ÉVÉNEMENT AUDIO ET SUPPORT DE STOCKAGE LISIBLE PAR ORDINATEUR
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/047703 N° de la demande internationale : PCT/CN2018/100939
Date de publication : 14.03.2019 Date de dépôt international : 17.08.2018
CIB :
G10L 15/06 (2013.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
06
Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
Déposants :
腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; 中国广东省深圳市 南山区高新区科技中一路腾讯大厦35层 35/F, Tencent Building, Kejizhongyi Road, Midwest District of Hi-tech park Nanshan District Shenzhen, Guangdong 518057, CN
Inventeurs :
刘海波 LIU, Haibo; CN
Mandataire :
北京德琦知识产权代理有限公司 DEQI INTELLECTUAL PROPERTY LAW CORPORATION; 中国北京市 海淀区知春路1号学院国际大厦7层 7/F, Xueyuan International Tower Haidian District, No. 1 Zhichun Road Beijing 100083, CN
Données relatives à la priorité :
201710797265.206.09.2017CN
Titre (EN) AUDIO EVENT DETECTION METHOD AND DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF DE DÉTECTION D'ÉVÉNEMENT AUDIO ET SUPPORT DE STOCKAGE LISIBLE PAR ORDINATEUR
(ZH) 音频事件检测方法、装置及计算机可读存储介质
Abrégé :
(EN) Provided are an audio event detection method and device, and a computer-readable storage medium, the method comprising: performing framing processing on an audio to be checked to obtain audio data of each time period in the audio to be checked, and respectively extracting a specified feature vector from the audio data of each time period (401); inputting the specified feature vector of the audio data of each time period to a unidirectional or bidirectional recurrent neural network (RNN/BI-RNN) model obtained by means of training to obtain the posterior probability of each pre-set audio event in the audio data of each time period (402); and with respect to each time period, according to the posterior probability of each audio event in the audio data of the time period and a pre-set audio decoding algorithm, obtaining a target audio event of the audio data of the time period, and with respect to the target audio event of any time period, extracting the optimal audio data sequence of the target audio event from the audio data of each time period (403).
(FR) L'invention concerne un procédé et un dispositif de détection d'événement audio, ainsi qu’un support de stockage lisible par ordinateur, ledit procédé consistant à : effectuer un traitement de cadrage sur une fréquence audio à détecter afin d’obtenir les données audio de chaque période dans la fréquence audio à détecter, puis extraire respectivement un vecteur de caractéristiques spécifié à partir des données audio de chaque période (401) ; entrer le vecteur de caractéristiques spécifié des données audio de chaque période dans un modèle de réseau neuronal récurrent unidirectionnel ou bidirectionnel (RNN/BI-RNN) obtenu par apprentissage afin d’obtenir la probabilité postérieure de chaque événement audio prédéfini dans les données audio de chaque période (402) ; et par rapport à chaque période, en fonction de la probabilité postérieure de chaque événement audio dans les données audio de la période et d'un algorithme de décodage audio prédéfini, obtenir un événement audio cible des données audio de la période et, par rapport à l'événement audio cible de n'importe quelle période, extraire la séquence de données audio optimale de l'événement audio cible à partir des données audio de chaque période (403).
(ZH) 一种音频事件检测方法、装置及计算机可读存储介质,方法包括:对待检测的音频进行分帧处理得到待检测的音频中各时间段的音频数据,从各时间段的音频数据中分别提取指定特征向量(401);将各时间段的音频数据的指定特征向量输入训练得到的单向或双向循环神经网络RNN/BI-RNN模型中,得到预设的各音频事件在各时间段的音频数据中的后验概率(402);针对每个时间段,根据时间段的音频数据中各音频事件的后验概率及预置的音频解码算法得到时间段的音频数据的目标音频事件;针对任一时间段的目标音频事件,从各时间段的音频数据中提取出目标音频事件的最佳音频数据序列(403)。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)