Processing

Please wait...

Settings

Settings

Goto Application

1. WO2023283823 - SPEECH ADVERSARIAL SAMPLE TESTING METHOD AND APPARATUS, DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM

Publication Number WO/2023/283823
Publication Date 19.01.2023
International Application No. PCT/CN2021/106236
International Filing Date 14.07.2021
IPC
G10L 15/01 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
01Assessment or evaluation of speech recognition systems
G10L 17/02 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis or principal components; Feature selection or extraction
CPC
G10L 15/01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
01Assessment or evaluation of speech recognition systems
G10L 15/063
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
063Training
Applicants
  • 东莞理工学院 DONGGUAN UNIVERSITY OF TECHNOLOGY [CN]/[CN]
Inventors
  • 罗达 LUO, Da
  • 马健 MA, Jian
  • 王艺 WANG, Yi
Agents
  • 深圳市爱迪森知识产权代理事务所(普通合伙) SHENZHEN AIDISEN INTELLECTUAL PROPERTY OFFICE
Priority Data
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SPEECH ADVERSARIAL SAMPLE TESTING METHOD AND APPARATUS, DEVICE, AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE TEST D'ÉCHANTILLON CONTRADICTOIRE DE LA PAROLE, DISPOSITIF ET SUPPORT DE STOCKAGE LISIBLE PAR ORDINATEUR
(ZH) 语音对抗样本检测方法、装置、设备及计算机可读存储介质
Abstract
(EN) A method and apparatus for training a speech adversarial sample testing model, and a device, and a computer-readable storage medium. The method comprises: acquiring speech training samples, wherein the speech training samples comprise a plurality of normal speech samples and a plurality of adversarial speech samples (110); performing spectrogram feature extraction on the speech training samples to respectively obtain positive sample spectrograms and negative sample spectrograms (120); and respectively inputting the positive sample spectrograms and the negative sample spectrograms into a preset neural network for training, so as to obtain a speech adversarial sample testing model (130). According to the method, the accurate testing of speech adversarial samples is achieved.
(FR) L'invention concerne un procédé et un appareil d'apprentissage d'un modèle de test d'échantillon contradictoire de la parole, un dispositif et un support de stockage lisible par ordinateur. Le procédé consiste à : acquérir des échantillons d'apprentissage de la parole, les échantillons d'apprentissage de la parole comprenant une pluralité d'échantillons de parole normaux et une pluralité d'échantillons de parole contradictoires (110) ; réaliser une extraction de caractéristiques de spectrogramme sur les échantillons d'apprentissage de la parole pour obtenir respectivement des spectrogrammes d'échantillons positifs et des spectrogrammes d'échantillons négatifs (120) ; et entrer respectivement les spectrogrammes d'échantillons positifs ainsi que les spectrogrammes d'échantillons négatifs dans un réseau neuronal prédéfini pour l'apprentissage, de façon à obtenir un modèle de test d'échantillon contradictoire de la parole (130). Selon le procédé, le test précis d'échantillons contradictoires de la parole est obtenu.
(ZH) 一种语音对抗样本检测模型的训练方法、装置、设备及计算机可读存储介质,所述方法包括:获取语音训练样本,语音训练样本包括多个正常语音样本及多个对抗语音样本(110);将所述语音训练样本进行语谱图特征提取,分别得到正样本语谱图及负样本语谱图(120);将所述正样本语谱图和负样本语谱图分别输入预设神经网络进行训练,得到语音对抗样本检测模型(130)。所述方法实现了对语音对抗样本的准确检测。
Related patent documents
Latest bibliographic data on file with the International Bureau