Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020088131 - CONVOLUTIONAL NEURAL NETWORK COMPUTING ACCELERATION METHOD AND APPARATUS, DEVICE, AND MEDIUM

Publication Number WO/2020/088131
Publication Date 07.05.2020
International Application No. PCT/CN2019/106083
International Filing Date 17.09.2019
IPC
G06N 3/04 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
Applicants
  • 北京嘉楠捷思信息技术有限公司 CANAAN CREATIVE CO., LTD [CN]/[CN]
Inventors
  • 郭晖 GUO, Hui
  • 张楠赓 ZHANG, Nangeng
Agents
  • 北京市中伦律师事务所 ZHONG LUN LAW FIRM
Priority Data
201811286575.931.10.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) CONVOLUTIONAL NEURAL NETWORK COMPUTING ACCELERATION METHOD AND APPARATUS, DEVICE, AND MEDIUM
(FR) PROCÉDÉ ET APPAREIL D'ACCÉLÉRATION DE CALCUL DE RÉSEAU NEURONAL CONVOLUTIF, DISPOSITIF ET SUPPORT
(ZH) 一种卷积神经网络计算加速方法及装置、设备、介质
Abstract
(EN)
Disclosed in the present application are a convolutional neural network computing acceleration method and apparatus, a device, and a medium. The method at least comprises: quantizing an original input tensor and convolution kernel by using a first function to obtain an input tensor and convolution kernel in a fixed-point number form; computing respective quantization offsets of the input tensor and convolution kernel in the fixed-point number form by using a second function, wherein the first function and the second function comprise corresponding quantization scaling factors, and conversion logic for converting a floating-point number into a fixed-point number; computing a first convolution result of the input tensor and convolution kernel in the fixed-point number form according to the quantization offsets; and computing a second convolution result of the original input tensor and convolution kernel according to the quantization scaling factors and the first convolution kernel. The present application uses conversion logic for converting a floating-point number into a fixed-point number, and adaptive quantization based on quantization offsets, thereby facilitating improving the convolution computation speed, improving the algorithm performance, and reducing the power consumption and design difficulty of hardware.
(FR)
La présente invention concerne un procédé et un appareil d'accélération de calcul de réseau neuronal convolutif, un dispositif et un support. Le procédé comprend au moins les étapes suivantes : quantifier un tenseur d'entrée d'origine et un noyau de convolution en utilisant une première fonction pour obtenir un tenseur d'entrée et un noyau de convolution sous une forme de nombre à virgule fixe ; calculer des décalages de quantification respectifs du tenseur d'entrée et du noyau de convolution sous la forme de nombre à virgule fixe en utilisant une deuxième fonction, la première fonction et la deuxième fonction comprenant des facteurs de mise à l'échelle de quantification correspondants, et une logique de conversion pour convertir un nombre à virgule flottante en un nombre à virgule fixe ; calculer un premier résultat de convolution du tenseur d'entrée et du noyau de convolution sous la forme de nombre à virgule fixe selon les décalages de quantification ; et calculer un deuxième résultat de convolution du tenseur d'entrée d'origine et du noyau de convolution selon les facteurs de mise à l'échelle de quantification et le premier noyau de convolution. La présente invention utilise une logique de conversion pour convertir un nombre à virgule flottante en un nombre à virgule fixe, et une quantification adaptative basée sur des décalages de quantification, ce qui facilite l'amélioration de la vitesse de calcul de convolution, améliore la performance d'algorithme, et réduit la consommation d'énergie et la difficulté de conception du matériel.
(ZH)
本申请公开了一种卷积神经网络计算加速方法及装置、设备、介质。该方法至少包括:利用第一函数,对原始的输入张量和卷积核进行量化处理,得到定点数形式的输入张量和卷积核;利用第二函数,计算定点数形式的输入张量和卷积核分别的量化偏移,第一函数和第二函数包含相应的量化缩放系数,以及浮点数转定点数的转换逻辑;根据量化偏移,计算定点数形式的输入张量和卷积核的第一卷积结果;根据量化缩放系数和第一卷积结果,计算原始的输入张量和卷积核的第二卷积结果。本申请利用浮点数转定点数的转换逻辑,以及基于量化偏移的自适应量化处理,有利于提高卷积计算速度,提高算法性能,降低硬件功耗和设计难度。
Latest bibliographic data on file with the International Bureau