中文 英语
技术论文

加速使用内存中的卷积神经网络计算的推理

方法来加速卷积神经网络(cnn)使用内存中的计算

受欢迎程度

文摘:

“内存计算(IMC)是一个non-von诺伊曼范式,最近成为一个有前途的方法节能,高吞吐量深度学习应用程序的硬件。IMC的一个重要应用是执行矩阵向量乘法O(1)">(1)时间复杂度的突触权重映射神经网络层设备的IMC核心。然而,由于明显不同的执行模式相比之前的计算范例,IMC需要反思的建筑设计选择在设计深度学习硬件。在这项工作中,我们专注于特定于应用程序的,IMC硬件卷积神经网络(cnn)的推理,并提供方法来实施IMC的各种建筑组件的核心。具体来说,我们提出的方法映射突触权重和激活内存结构和提供证据的各种权衡,如一片上内存需求和执行之间的延迟。最后,我们展示了如何使用这些方法来实现一个管线式数据流提供吞吐量和延迟超越先进的图像分类任务。”

访问这个开放获取技术论文在这里。公布的08/2021。

Dazzi, M。塞巴斯蒂安,。Benini, L。、& Eleftheriou大肠(2021年8月3日)。加速使用内存中的卷积神经网络计算的推理。前沿。检索2021年11月9日,来自https://www.frontiersin.org/articles/10.3389/fncom.2021.674154/full。



留下一个回复


(注意:这个名字会显示公开)

Baidu