中文 英语

ISA和微架构扩展在密集矩阵引擎上支持cpu的灵活结构化稀疏性(佐治亚理工学院,英特尔实验室)


佐治亚理工学院和英特尔实验室的研究人员发表了一篇题为“VEGETA: cpu上稀疏/密集GEMM瓦加速的垂直集成扩展”的技术论文(预印本)。摘要:“cpu中的深度学习(DL)加速支持最近获得了很大的吸引力,几家公司(Arm, Intel, IBM)宣布了具有专用矩阵引擎的产品。»阅读更多

Gemmini:开源、全栈DNN加速器生成器(DAC最佳论文)


这篇题为“Gemmini:通过全堆栈集成实现系统深度学习架构评估”的技术论文由加州大学伯克利分校的研究人员和麻省理工学院的合著者联合发表。该研究由DARPA部分资助,并获得了DAC 2021年最佳论文奖。论文介绍了Gemmini,“一种用于DNN工作负载的开源、全堆栈DNN加速器生成器,使端到端…»阅读更多

基于CIM架构和模拟NVM的大规模dnn可行性评估仿真框架


加州大学洛杉矶分校研究人员撰写的题为“模拟内存计算推理引擎的准确性和弹性”的技术论文。“最近,基于新兴模拟非易失性存储器(NVM)技术的模拟内存计算(CIM)架构已被用于深度神经网络(dnn),以提高可扩展性、速度和能源效率。然而,这样的架构利用了……»阅读更多

Baidu