超大型HW神经结构优化搜索(谷歌)


新技术论文题为“超大型硬件优化的神经结构搜索”由研究人员发表在谷歌,苹果和Waymo。“介绍第一个超大型硬件优化的神经结构搜索(H2O-NAS)自动设计准确和高性能机器学习模型根据底层硬件体系结构。H2O-NAS包括三个……»阅读更多

fpga:自动化框架建筑空间探索近似加速器


技术论文题为“autoXFPGAs:端到端的自动化勘查近似加速器在fpga系统框架”(预印本)发表你的研究人员维恩,布尔诺科技大学,NYUAD。文摘”一代和探索近似电路和加速器是一个著名的研究领域探索节能和/或性能……»阅读更多

HW框架,最小化算法精度退化,数据移动,能源消费款加速器(佐治亚理工学院)


这个新研究论文题为“一个Algorithm-Hardware合作设计框架,克服缺陷的混合信号款加速器”是佐治亚理工学院的研究人员发表的。根据论文的文摘,“近年来,在内存中处理(PIM)基于混合信号设计已经被提议作为能源和area-efficient解决方案具有超高流量加速com款……»阅读更多

超低功耗硬件加速器的框架使用NNs嵌入时间序列分类


使用神经网络在嵌入式应用程序(NNs)分类任务,重要的是不仅减少神经网络的功耗计算,但整个系统。优化方法各个部分存在,如量化神经网络或模拟计算的算术运算。然而,没有整体的一个完整的嵌入式系统设计方法……»阅读更多

形式:细粒度的极化ReRAM-based原位计算混合信号款加速器


文摘:“最近工作证明的承诺使用电阻随机存取内存(ReRAM)作为一项新兴技术本质上执行并行模拟域原位矩阵向量multiplication-the密集和关键计算深层神经网络(款)。一个关键问题是签署的权重值。然而,在ReRAM横梁、重量被存储为电导……»阅读更多

硬件架构和软件堆栈基于商业DRAM的PIM技术


文摘:“新兴应用,如深层神经网络芯片外高内存带宽的需求。然而,在严格的物理约束的系统和芯片包板,它变得非常昂贵的进一步增加片外存储器的带宽。此外,传输数据在内存层次结构构成的系统总能耗的大部分,以及……»阅读更多

莎拉:比例可重构数据流加速器


张雅琦,内森田赵,马特•Vilim穆罕默德沙赫巴兹Kunle Olukotun(斯坦福大学)摘要-“现代数据密集型工作负载的需要,一种加速的需要和崛起的“黑硅”在半导体行业正在推动更大、更快、更多的能量和areaefficient架构,如可重构数据流加速器(rda)。然而,挑战仍然存在在d…»阅读更多

挑战芯片开发一种新的推论


程,软件和工程的高级副总裁和创始人之一Flex Logix,坐下来与半导体工程解释为市场带来一个推论加速器芯片的过程,从启动、编程和分区涉及速度和定制的权衡。SE:推测边缘芯片只是开始进入市场。di什么挑战……»阅读更多

NN-Baton:工作量编制款& Chiplet粒度勘探多片加速器


“摘要革命机器学习带来了前所未有的对计算资源的需求,呼吁更多的晶体管在一个单片芯片,在Post-Moore时代是不可持续的。多片与小的集成功能死了,叫chiplets,可以降低生产成本,提高生产产量,实现文明程度重用不同系统尺度…»阅读更多

验证PULPino RISCY核心谷歌加速器的刺痛


作者:Shubhodeep罗伊·Choudhury1 Shajid Thiruvathodi2, Vaidyanathan Seetharaman3,马特•Cockrell4 Jon Michelson5杰森Redgrave6 Valtrix技术私人有限,班加罗尔,INDIA1, 2谷歌(Google Inc .),山景城USA3, 4, 5, 6文摘:——谷歌使用PULPino RISC-V核心RISCY作为作业调度和调度机制的硬件加速器(类似于GPU控制器)。这个…»阅读更多

←旧的文章
Baidu