技术论文

低功耗的异构计算集群TinyML款推理和芯片上的培训

受欢迎程度

新技术论文题为“黑暗面”:异构RISC-V计算集群的边缘领域芯片上的推理和培训款“被博洛尼亚大学的研究人员发表,苏黎世联邦理工学院。

文摘

“芯片上的深(款)推理和神经网络训练的边缘领域(TinyML)严格延迟、吞吐量、准确性、和灵活性的要求。异构集群是有前途的解决方案以满足这个挑战,结合DSP-enhanced核心的灵活性和专用加速器的性能和能量增加。我们现在的黑暗面,soc的异构集群八RISC-V核心加强与2 b 32-b mixed-precision整数算术。提高性能和效率的关键计算密集型款内核,集群是富含三个数字加速器:1)专业引擎low-data-reuse切除卷积核(30 MAC /周期);2)一个最小的开销datamover元帅1-32-b数据动态;和3)16 b浮点张量积引擎(TPE)平铺的矩阵乘法加速度。黑暗面在65 nm CMOS技术实现。集群性能达到一个峰值整数65年共和党和最高效率的835年共和党/ W当工作在2 b整款内核。当针对浮点张量操作,TPE提供18.2 GFLOPS性能或300 GFLOPS / W efficiency-enough使片上浮点训练速度竞争加上超低功率量化推理。”

找到这里的技术论文。2022年9月出版。

A . Garofalo et al .,“黑暗面”:异构RISC-V计算集群的边缘领域芯片上的推理和培训,款“在IEEE开放杂志的固态电路社会,2卷,第243 - 231页,2022年,doi: 10.1109 / OJSSCS.2022.3210082。



留下一个回复


(注意:这个名字会显示公开)

Baidu