中文 英语

不要让你的ML加速器供应商告诉你“f字”


设备中的机器学习(ML)推理正在风靡。几乎每一个用于移动电话、平板电脑、智能安全摄像头、汽车应用程序、无线系统等的新的片上系统(SoC)设计都需要大量的片上ML功能。这使得硅设计团队争相寻找ML处理能力,以添加到现有的处理引擎菜单中……»阅读更多

GDDR6内存支持高性能AI/ML推断


推理模型的规模和复杂性的迅速增长,使得在网络边缘和端点设备上部署越来越强大的硬件成为必要。为了让这些推断处理器和加速器能够获得数据,需要提供极高带宽的最先进的内存。这篇博客将探讨GDDR6如何支持artif的内存和性能要求。»阅读更多

从加速感知ML模型设计中获得更好的边缘性能和效率


机器学习技术的出现得益于gpu、tpu和fpga等加速技术的使用。事实上,如果没有加速技术的使用,机器学习很可能仍然停留在学术界的范围内,不会产生今天在我们世界上的影响。显然,机器学习已经成为解决……的重要工具。»阅读更多

边缘与云之间的权衡


越来越多的处理是在边缘上完成的,但云计算与边缘计算之间的平衡将如何变化尚不清楚。答案可能既取决于技术限制,也取决于数据的价值和其他商业原因。钟摆一直在摇摆,要么在云端进行所有处理,要么在云端进行越来越多的处理。»阅读更多

领先的GDDR6内存


随着数据流量的加速增长,超大规模数据中心的数量不断飙升也就不足为奇了。Synergy Research Group的分析师表示,在9个月内(20年第二季度至21年第一季度),有84个新的超大规模数据中心上线,使全球数据中心总数达到625个。超规模资本支出在过去四个季度创下了1500亿美元的记录,超过了……»阅读更多

RaPiD:用于超低精度训练和推断的AI加速器


摘要-“人工智能(AI)工作负载的日益流行和计算需求导致在其执行中广泛使用硬件加速器。跨代扩展AI加速器的性能是其在商业部署中取得成功的关键。人工智能工作负载的内在错误弹性特性为性能/能源成本提供了独特的机会。»阅读更多

边缘AI推理的挑战


将卷积神经网络(cnn)引入您的行业——无论是医疗成像、机器人还是其他一些视觉应用程序——都有可能实现新功能,并减少现有工作负载的计算需求。这是因为单个CNN可以取代计算成本更高的图像处理、去噪和目标检测算法。Howev……»阅读更多

开发新型推理芯片的挑战


Flex Logix联合创始人兼软件和工程高级副总裁王诚(Cheng Wang)接受了《半导体工程》(Semiconductor engineering)的采访,解释了将推理加速器芯片推向市场的过程,从启动、编程和分区到涉及速度和定制的权衡。SE:边缘推断芯片才刚刚开始进入市场。挑战是什么?»阅读更多

AI的架构考虑


被称为人工智能(AI)或机器学习(ML)的定制芯片每周都会出现,每种芯片都声称比现有设备快10倍或消耗1/10的功率。这是否足以取代现有的架构(如gpu和fpga),或者它们是否能与这些架构共存尚不清楚。问题,或者说机会在于……»阅读更多

为什么可重构性对AI边缘推断吞吐量至关重要


为了让神经网络以最快的速度运行,底层硬件必须在所有层上高效运行。通过对任何cnn的推断(无论是基于YOLO、ResNet还是初始化),工作负载都有规律地从内存瓶颈转移到计算资源瓶颈。您可以将每个卷积层视为其自己的迷你工作负载,因此……»阅读更多

←老帖子
Baidu