Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022022625 - ACCELERATION METHOD AND DEVICE FOR DEEP LEARNING MODEL

Publication Number WO/2022/022625
Publication Date 03.02.2022
International Application No. PCT/CN2021/109187
International Filing Date 29.07.2021
IPC
G06N 3/04 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
G06N 3/063 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
063using electronic means
G06N 3/08 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
CPC
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/063
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
063using electronic means
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
Applicants
  • 北京智行者科技有限公司 BEIJING IDRIVERPLUS INFORMATION TECHNOLOGY CO., LTD. [CN]/[CN]
Inventors
  • 付家为 FU, Jiawei
  • 陈东 CHEN, Dong
  • 张放 ZHANG, Fang
  • 李晓飞 LI, Xiaofei
  • 张德兆 ZHANG, Dezhao
  • 王肖 WANG, Xiao
  • 霍舒豪 HUO, Shuhao
Agents
  • 北京市中伦律师事务所 ZHONG LUN LAW FIRM
Priority Data
202010745500.329.07.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) ACCELERATION METHOD AND DEVICE FOR DEEP LEARNING MODEL
(FR) PROCÉDÉ ET DISPOSITIF D'ACCÉLÉRATION DESTINÉS À UN MODÈLE D'APPRENTISSAGE PROFOND
(ZH) 深度学习模型的加速方法及装置
Abstract
(EN) The present invention provides an acceleration method for a deep learning model, comprising: acquiring a contribution value of each channel of a plurality of channels in each convolution layer of the model; according to the contribution values of all the channels in all the convolution layers, clipping the channels in the convolution layers of the model to obtain a clipped model; separately training the model and the clipped model; respectively evaluating the trained model and the trained clipped model to obtain a first evaluation value and a second evaluation value; and according to the first evaluation value and the second evaluation value, determining whether to output the trained clipped model as a new model. Therefore, reasoning speed is greatly increased without losing reasoning precision or with a very small loss of reasoning precision.
(FR) La présente invention concerne un procédé d'accélération d'un modèle d'apprentissage profond, consistant : à acquérir une valeur de contribution de chaque canal d'une pluralité de canaux dans chaque couche de convolution du modèle ; en fonction des valeurs de contribution de tous les canaux dans toutes les couches de convolution, à écrêter les canaux dans les couches de convolution du modèle pour obtenir un modèle écrêté ; à former séparément le modèle et le modèle écrêté ; à évaluer respectivement le modèle formé et le modèle écrêté formé afin d'obtenir une première valeur d'évaluation et une seconde valeur d'évaluation ; et en fonction de la première valeur d'évaluation et de la seconde valeur d'évaluation, à déterminer s'il faut produire le modèle écrêté formé sous la forme d'un nouveau modèle. Par conséquent, la vitesse de raisonnement est fortement accrue sans perte de la précision de raisonnement ou avec une très faible perte de la précision de raisonnement.
(ZH) 本发明提供了一种深度学习模型的加速方法,包括:获取模型中的每个卷积层中的多个通道中每个通道的贡献值;根据全部卷积层中各通道的贡献值,对模型中的卷积层中的通道进行裁剪,得到裁剪后的模型;对模型和裁剪后的模型分别进行训练;对训练后的模型和裁剪后训练的模型分别进行评估,得到第一评估值和第二评估值;根据第一评估值和第二评估值,确定是否将裁剪后训练的模型作为新模型输出。由此,在推理精度不损失或者损失非常小的情况下,实现推理速度的大大提升。
Related patent documents
Latest bibliographic data on file with the International Bureau