Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022007265 - DILATED CONVOLUTION ACCELERATION CALCULATION METHOD AND APPARATUS

Publication Number WO/2022/007265
Publication Date 13.01.2022
International Application No. PCT/CN2020/126195
International Filing Date 03.11.2020
IPC
G06N 3/063 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
063using electronic means
Applicants
  • 嘉楠明芯(北京)科技有限公司 CANAAN BRIGHT SIGHT CO., LTD [CN]/[CN]
Inventors
  • 徐兵 XU, Bing
  • 张楠赓 ZHANG, Nangeng
Agents
  • 北京市中伦律师事务所 ZHONG LUN LAW FIRM
Priority Data
202010659646.608.07.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) DILATED CONVOLUTION ACCELERATION CALCULATION METHOD AND APPARATUS
(FR) PROCÉDÉ ET APPAREIL DE CALCUL D'ACCÉLÉRATION DE CONVOLUTION DILATÉE
(ZH) 一种膨胀卷积加速计算方法及装置
Abstract
(EN) A dilated convolution acceleration calculation method and apparatus. The method comprises: decomposing a dilated convolution computation of R×S into S sub-dilated convolution computations of R×1 (301); for each sub-dilated convolution computation, caching a plurality of weight values in parallel to a plurality of calculation units in a calculation unit array (302); determining, from input image data, a plurality of input data streams respectively corresponding to the plurality of weight values, and inputting the plurality of input data streams in parallel into the plurality of calculation units (303); within the plurality of calculation units, executing a sliding window operation and a multiplication operation on the basis of the cached weight values and the input data streams, and executing an accumulation operation between the plurality of calculation units, so as to output an intermediate result of the sub-dilated convolution computation (304); and superimposing intermediate results of the S sub-dilated convolution computations of R×1, so as to obtain a convolution result of the dilated convolution computation (305). By using the method, a dilated convolution operation is accelerated with a relatively low complexity, and the function of Im2col does not need to be separately realized, thereby reducing the complexity.
(FR) L'invention concerne un procédé et un appareil de calcul d'accélération de convolution dilatée. Le procédé consiste à : décomposer un calcul de convolution dilatée de R×S en S sous-calculs de convolution dilatée de R×1 (301) ; pour chaque sous-calcul de convolution dilatée, mettre en mémoire cache une pluralité de valeurs de poids en parallèle dans une pluralité d'unités de calcul d’un réseau d'unités de calcul (302) ; déterminer, à partir des données d'image d'entrée, une pluralité de flux de données d'entrée correspondant respectivement à la pluralité de valeurs de poids, puis entrer la pluralité de flux de données d'entrée en parallèle dans la pluralité d'unités de calcul (303) ; dans la pluralité d'unités de calcul, exécuter une opération de fenêtre glissante et une opération de multiplication d’après les valeurs de poids mises en mémoire cache et les flux de données d'entrée, puis exécuter une opération d'accumulation entre la pluralité d'unités de calcul afin de générer un résultat intermédiaire du sous-calcul de convolution dilatée (304) ; et superposer les résultats intermédiaires des S sous-calculs de convolution dilatée de R×1 afin d’obtenir un résultat de convolution du calcul de convolution dilatée (305). En utilisant le procédé, une opération de convolution dilatée est accélérée avec une complexité relativement faible, et la fonction d'Im2col n'a pas besoin d'être réalisée séparément, ce qui permet de réduire la complexité.
(ZH) 一种膨胀卷积加速计算方法及装置,其中该方法包括:将R×S的膨胀卷积运算分解为S个R×1的子膨胀卷积运算(301);针对每个子膨胀卷积运算,将多个权重值并行缓存至计算单元阵列中的多个计算单元(302);从输入图像数据中确定分别对应于多个权重值的多路输入数据流,将多路输入数据流并行输入多个计算单元(303);在多个计算单元内部,基于缓存的权重值和输入数据流执行滑窗操作和乘法操作,并在多个计算单元之间执行累加操作,以输出所述子膨胀卷积运算的中间结果(304);叠加S个R×1的子膨胀卷积运算的中间结果,得到膨胀卷积运算的卷积结果(305)。利用上述方法,以较低复杂度实现加速膨胀卷积运算,不需要单独实现Im2col的功能,降低了复杂度。
Latest bibliographic data on file with the International Bureau