(EN) Provided are an accelerator for a neural network, an acceleration method and device, and a computer storage medium.
The accelerator comprises: a feature map loading module for acquiring a first input feature map of a convolutional layer (510); a convolutional kernel loading module for acquiring multiple first convolutional kernels having different fixed-point modes (520); a shift information loading module for acquiring multiple first shift information corresponding to the multiple first convolutional kernels on a one-to-one basis (530); a multiply-accumulate calculation module for performing an inner product operation on the first feature map and the first convolutional kernels to obtain a first output feature map (540); a shift module for performing shift operations respectively on multiple channels of the first output feature map (550); and an output module for outputting the first output feature map after the shift (560).
The depthwise fixed-point mode adopted is more efficient than a floating point operation, and the adoption of a more flexible fixed-point mode instead of a single fixed-point mode can improve the calculation precision after the neural network is fixed-pointed.
(FR) L'invention concerne un accélérateur pour un réseau de neurones artificiels, un procédé et un appareil d'accélération, et un support d'enregistrement informatique. L'accélérateur comprend : un module de chargement de carte de caractéristiques pour acquérir une première carte de caractéristiques d'entrée d'une couche de convolution (510) ; un module de chargement de noyau de convolution pour acquérir de multiples premiers noyaux de convolution ayant différents modes de point fixe (520) ; un module de chargement d'informations de décalage pour acquérir de multiples premières informations de décalage correspondant aux multiples premiers noyaux de convolution sur une base biunivoque (530) ; un module de calcul de multiplication-accumulation pour effectuer une opération de produit interne sur la première carte de caractéristiques et les premiers noyaux de convolution afin d'obtenir une première carte de caractéristiques de sortie (540) ; un module de décalage pour effectuer des opérations de décalage respectivement sur de multiples canaux de la première carte de caractéristiques de sortie (550) ; et un module de sortie pour délivrer en sortie la première carte de caractéristiques de sortie après le décalage (560). Le mode à point fixe en profondeur adopté est plus efficace qu'une opération à virgule flottante, et l'adoption d'un mode à point fixe plus flexible au lieu d'un seul mode à point fixe peut améliorer la précision de calcul après que le réseau de neurones artificiels a été fixé-pointé.
(ZH) 提供了用于神经网络的加速器、方法、装置及计算机存储介质。该加速器包括:用于获取卷积层的第一输入特征图的特征图加载模块(510);用于获取不同定点化方式的多个第一卷积核的卷积核加载模块(520);用于获取与多个第一卷积核一一对应的多个第一移位信息的移位信息加载模块(530);用于对第一特征图和第一卷积核进行内积运算得到第一输出特征图的乘加计算模块(540);用于将第一输出特征图的多个通道分别执行移位操作的移位模块(550);用于输出移位之后的第一输出特征图的输出模块(560)。可见,采用了分通道定点化的方式,相对于浮点运算更加高效,且不采用单一的定点化而是更灵活的定点化方式,能提高神经网络定点化后的计算精度。