定制的微型基准测试中对HW / SW性能


原始性能用于基准测试的主要焦点,但他们为许多应用程序可能已经失效。达纳·麦卡蒂,负责销售和营销的副总裁AI推理产品Flex Logix,谈到为什么公司需要开发和利用自己的特定模型来准确测定硬件和软件性能,可降低瓶颈在I / O和…»阅读更多

ResNet-50不预测推理吞吐量为像素的神经网络模型


客户正在考虑申请人工智能推理和想要评估多个推理加速器。正如我们上个月讨论的,上衣不与推理的吞吐量和你应该使用真正的神经网络模型基准加速器。所以ResNet-50是个好基准评估的相对表现推理加速器吗?如果您的应用程序将p…»阅读更多

优化机器学习的新方法


随着越来越多的设计师采用机器学习(ML)在他们的系统中,他们从简单应用程序工作的功率和性能优化的实现。今天可用的一些技术。别人需要一段时间才能渗透通过之前的设计流程和工具成为现成的主流设计师。任何新技术是一个基本的…»阅读更多

在推理软件加速器


的首席执行官杰夫•泰特Flex Logix,谈到推理加速器硬件软件合作设计的重要性,如何影响性能和权力,以及新方法芯片制造商正在将人工智能芯片市场。»阅读更多

内存子系统推论芯片边缘


Flex Logix,首席执行官杰夫•泰特谈到关键问题在一个推论芯片内存子系统、热等因素如何影响性能,这些芯片将被使用。»阅读更多

人工智能推理记忆系统权衡


当公司描述他们的人工智能推理芯片他们通常给上衣但不谈论他们的记忆系统,这是同样重要的。上衣是什么?这意味着每秒数万亿或拉操作。它主要是一个测量的最大可以达到的吞吐量,但是不是一个实际的吞吐量。大多数业务都是MAC(乘/积累),所以上衣= (MAC的数量单位)x……»阅读更多

推理加速度:遵循记忆


已经有很多关于推理加速度的计算复杂度:非常大的矩阵乘法的全层,大量3 x3沟回在像素的图片,这两个需要成千上万的mac (multiplier-accumulators)实现高吞吐量模型ResNet-50和YOLOv3等。硬币的另一面是管理d的运动……»阅读更多

Baidu