Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020113575 - SOUND CLASSIFICATION METHOD, DEVICE AND MEDIUM BASED ON SEMI-NONNEGATIVE MATERIX FACTORIZATION WITH CONSTRAINT

Publication Number WO/2020/113575
Publication Date 11.06.2020
International Application No. PCT/CN2018/119894
International Filing Date 07.12.2018
IPC
G10L 25/51 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
48specially adapted for particular use
51for comparison or discrimination
G01L 21/08 2006.01
GPHYSICS
01MEASURING; TESTING
LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
21Vacuum gauges
08by measuring variations in the transmission of acoustic waves through the medium, the pressure of which is to be measured
CPC
G01L 21/08
GPHYSICS
01MEASURING; TESTING
LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
21Vacuum gauges
08by measuring variations in the transmission of acoustic waves through the medium, the pressure of which is to be measured
G10L 25/51
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
48specially adapted for particular use
51for comparison or discrimination
Applicants
  • 广东省智能制造研究所 GUANGDONG INSTITUTE OF INTELLIGENT MANUFACTURING [CN]/[CN]
Inventors
  • 韩威 HAN, Wei
  • 周松斌 ZHOU, Songbin
  • 李昌 LI, Chang
  • 刘忆森 LIU, Yisen
  • 刘伟鑫 LIU, Weixin
Agents
  • 广州容大专利代理事务所(普通合伙) GUANGZHOU RONDA PATENT AGENCY
Priority Data
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SOUND CLASSIFICATION METHOD, DEVICE AND MEDIUM BASED ON SEMI-NONNEGATIVE MATERIX FACTORIZATION WITH CONSTRAINT
(FR) PROCÉDÉ, DISPOSITIF ET SUPPORT DE CLASSIFICATION DE SONS BASÉS SUR UNE FACTORISATION DE MATRICE SEMI-NON-NÉGATIVE PRÉSENTANT UNE CONTRAINTE
(ZH) 基于约束半非负矩阵分解的声音分类方法、装置及介质
Abstract
(EN)
Disclosed are a sound classification method, device and medium based on semi-nonnegative matrix factorization with constraint. The sound classification method comprises the following steps: representing a training sound data sample and a testing sound data sample as a semi-nonnegative matrix (S1); constructing a category constraint matrix and a sparse constraint matrix according to the semi-nonnegative matrix (S2); performing semi-nonnegative matrix factorization with constraint on the semi-nonnegative matrix under category constraint and sparse constraint to obtain a corresponding coefficient matrix; training a classification model to obtain a classifier by using low-dimensional representation in the coefficient matrix corresponding to the training sound data sample and category information of the training sound data sample as training data (S3); inputting the low-dimensional representation in the coefficient matrix corresponding to the testing sound data sample into the classifier, and outputting a classification result of the testing sound data sample (S4). The method makes effective use of the category information of the training sound data sample and enables the low-dimensional representation after dimension reduction to have sparsity, thereby obtaining the low-dimensional representation of samples with better discrimination and improving the accuracy of the sound data classification method.
(FR)
L'invention concerne un procédé, un dispositif et un support de classification de sons basés sur une factorisation matricielle semi-non-négative présentant une contrainte. Le procédé de classification de sons comprend les étapes suivantes, consistant : à représenter un échantillon de données de sons d'apprentissage et un échantillon de données de sons de test sous la forme d'une matrice semi-non-négative (S1) ; à construire une matrice de contrainte de catégorie et une matrice de contrainte légère selon la matrice semi-non-négative (S2) ; à effectuer une factorisation de matrice semi-non-négative présentant une contrainte sur la matrice semi-non-négative sous contrainte de catégorie et sous contrainte légère afin d'obtenir une matrice de coefficients correspondante ; à apprendre un modèle de classification afin d'obtenir un classificateur, par utilisation d'une représentation de petites dimensions dans la matrice de coefficients correspondant à l'échantillon de données de sons d'apprentissage, et des informations de catégorie de l'échantillon de données de sons d'apprentissage, sous forme de données d'apprentissage (S3) ; à entrer la représentation de petites dimensions dans la matrice de coefficients correspondant à l'échantillon de données de sons de test dans le classificateur et à produire un résultat de classification de l'échantillon de données de sons de test (S4). Le procédé permet une utilisation efficace des informations de catégorie de l'échantillon de données de sons d'apprentissage et permet à la représentation de petites dimensions de présenter une faible densité après réduction des dimensions, ce qui permet d'obtenir la représentation de petites dimensions d'échantillons grâce à une bonne discrimination et d'améliorer la précision du procédé de classification de données de sons.
(ZH)
一种基于约束半非负矩阵分解的声音分类方法、装置及介质,该声音分类方法包括:将训练声音数据样本和测试声音数据样本表示为半非负矩阵(S1);根据半非负矩阵构建类别约束矩阵,并根据半非负矩阵构建稀疏约束矩阵(S2);在类别约束和稀疏约束下,对半非负矩阵进行约束半非负矩阵分解,得到对应的系数矩阵;将系数矩阵中对应于训练声音数据样本的低维表示以及训练声音数据样本的类别信息作为训练数据,对分类模型进行训练得到分类器(S3);将系数矩阵中对应于测试声音数据样本的低维表示输入分类器,输出测试声音数据样本的分类结果(S4)。该方法有效利用了训练声音数据样本的类别信息并使得降维后的低维表示具有稀疏性,从而得到更具区分性的样本低维表示,提高了声音数据分类方法的正确率。
Latest bibliographic data on file with the International Bureau