中文 英语
首页
技术论文

nn -接力棒:用于多芯片加速器的DNN工作负载编排和芯片粒度探索

nn -接力棒:用于多芯片加速器的DNN工作负载编排和芯片粒度探索

受欢迎程度

摘要:机器学习的革命对计算资源提出了前所未有的需求,在单个单片芯片上要求更多的晶体管,这在后摩尔时代是不可持续的。多芯片集成功能小的芯片,可以降低制造成本,提高制造良率,实现不同系统规模的芯片级复用。在这样的多芯片系统中,DNN工作负载映射和硬件设计空间探索是至关重要的,但目前尚缺乏。这项工作提供了一个层次和分析框架来描述多芯片加速器上的DNN映射并分析通信开销。基于此框架,我们提出了一个自动工具NN-Baton,它具有预设计流程和后设计流程。预设计流程旨在指导对给定区域和目标工作负载的性能预算进行芯片粒度探索。后期设计流程关注层次结构中不同计算级别(包、芯片和核心)上的工作负载编排。与Simba相比,NN-Baton生成的映射策略在相同的计算和内存配置下节省了22.5% ~ 44%的能量。体系结构探索表明,面积是影响芯片粒度的决定性因素。对于一个2048-MAC系统,在2 mm2芯片面积的限制下,4个芯片、4个核和16个8尺寸矢量mac通道的实现始终是多个基准测试的首选计算分配。 In contrast, the optimal memory allocation policy in the hierarchy typically depends on the neural network models.”

来源/作者:谭占红(清华大学)、蔡宏宇(清华大学);董润培(西安交通大学);马凯生(清华大学)。

找到这里是技术文件

技术文件于2021年ACM/IEEE第48届计算机体系结构国际研讨会



留下回复


(注:此名称将公开显示)

Baidu