AI FP8:跨行业硬件规范培训和推理(手臂、英特尔、英伟达)


手臂、英特尔和Nvidia提出了规范一个8位浮点(FP8)格式,可以提供一个通用的可互换格式适用于人工智能训练和推理,让人工智能模型和跨硬件平台的执行操作。找到技术论文题为“深度学习FP8格式”。2022年9月出版。文摘:“FP8是一种天然的p…»阅读更多

有更多的比cnn机器学习


神经网络——尤其是卷积神经网络(cnn)——已经收到了大量的注意力在过去的几年里,但它们不是唯一有用的机器学习结构。有许多其他方式为机器学习如何解决问题,还有其他机器学习的空间结构。“神经网络能做的这一切真的复合基…»阅读更多

使新的Edge-Inference架构


新的edge-inference机器学习架构已经到达一个惊人的速度在过去的一年。要了解它们的意义都是一个挑战。首先,并不是所有的ML体系结构是一样的。的一个复杂的因素在理解不同的机器学习架构是术语用来描述他们。你会看到像“sea-of-MACs”、“收缩……»阅读更多

Edge-Inference架构增殖


第一部分两部分组成。第二部分将深入基本建筑特点。去年有大量的宣布新的边缘推理机器学习(ML)架构。卸下了需要支持培训,但负责低延迟,设备表现出极其多样毫升推理方法。“建筑是改变在comp……»阅读更多

单片机的困境


卑微的单片机各方挤压。虽然大多数半导体行业已经能够利用摩尔定律,单片机市场摇摇欲坠,因为闪存不规模超过40 nm。同时,语音激活和更丰富的传感器网络等新功能要求推理引擎集成市场。另一方面,再保险……»阅读更多

在5/3nm IP管理和发展


搬到新流程节点不断增加的复杂性使其更加困难来创建、管理和重用IP。有更多的规则,更多的数据管理,和更多的潜在的相互作用随着密度的增加,在平面的实现和先进的包装。和问题变得更糟糕设计5和3 nm,和更多的异构组件如accelerato……»阅读更多

边缘推论的挑战


的CEO杰夫•泰特Flex Logix,谈到平衡不同变量来提高性能和降低电力以最低的成本可能为了做推论在边缘设备。https://youtu.be/1BTxwew--5U»阅读更多

让AI跑得更快


半导体行业已经认识到这一事实异构计算是前进的,推测将需要更多的比GPU和CPU。对于数字30左右公司工作在这个问题上100倍的性能改进。但是怎么没有这么简单。它需要四个主要变化,以及其他一些建筑转变……»阅读更多

加速神经网络


神经网络获得更多动力的最好方式收集和关键数据从物理世界和处理数字世界。现在的问题是如何加速整个过程。但它不是一个简单的工程挑战。神经网络本身是一个几乎恒定的流量和发展的状态,这使得它的一个移动的标靶。Th……»阅读更多

Baidu