中文 英语

Makimoto另一边的波

定制设计取得进展与标准化方法在各种新的应用程序。

受欢迎程度

自定义硬件正在经历一个巨大的复兴在各种各样的新应用,推动半导体产业的另一边Makimoto的波

Tsugio Makimoto,技术员确认芯片行业的10年周期性波动之间的标准化和定制,预计总将房间asic的通用处理器。但它是越来越难以依靠现成的处理元素的好处摩尔定律在每一个新节点递减。尤其适用于各种各样的新应用领域,有不同类型的数据处理。

“一个领域是人工intelligence-especially一些特定的机器学习类型的应用程序,”胡安·雷伊说,工程副总裁,口径,导师,西门子业务。“此外,巨大的具体领域的发展中扮演了一个很明确的理由客户特定的硬件。Cryptocurrency是一个地方有这么多的公司投资和太多的关注,因为在做本质上采矿,以及其他活动。另一个领域是医学影像,一个明确的定义良好的市场和单个算法的组合,或几个算法,控制绝大多数的性能或能耗的关键需求是解决特定的行业。”

段中需要执行的计算是不寻常的事情,如人工智能,许多工程团队想出自己的处理器架构,而不是使用一个通用的处理器以优化权力和最终成本、高级总监卡洛斯Macian说人工智能策略和产品eSilicon。“因为他们可以自由偏离标准冯诺依曼体系结构,他们引入小说概念,如near-memory计算内存计算等等。”

这是给新指令集架构如RISC-V优势由于其开放性,Macian说。license-free”它,因为它是开源的,它使得工程团队开发自己的指令集办法增多毛发特别是人工智能,能够操作向量和矩阵。这是一个巨大的优势。那是最好的,你可以与通用处理器完成,这就是为什么RISC-V空间也很受欢迎。”

首席执行官鲁珀特•贝恩斯UltraSoC认为,通用计算的定义将永远伴随着我们,但是当前的趋势是向更多的定制。“业内有一摆,你看到新架构,专门化,然后掉头向更通用的世界。”

他回忆说,第一批项目作为一个工程师他是有点像今天的AI架构。”在当时专业架构运行面向对象代码和本地机器运行Smalltalk,或者跑这个本地,然后一段时间后,大家都说,“这有点愚蠢。我们为什么不买一个x86和使用更好的编译器吗?和钟摆波动。”

然而,对于有些事情钟摆卡住,贝恩斯指出。“我不认为有人会使用一个通用的英特尔MMX图形指令。没有人会回到了因为图形是这样一个标准主要有一个架构将是有意义的;有一个协同处理器将永远是有意义的。也许人工智能将是类似的,将会有一个空间和一段,会有一个协同处理器将优化架构。”

,类似于一个特定的生态环境、特定的压力把事情在一定方向。“在一个物联网系统与疯狂的成本压力,你会得到不同的解决方案。一个推理引擎运行在一个低成本的物联网将得到不同的答案,而不是训练引擎运行在数据中心。现在我们在寒武纪大爆发的新思想和新事物,所以他们抛出。有40或50个不同的AI初创公司都推出主题的变奏。然后,英特尔、英伟达等,都是试图找出什么是最佳的平衡。有些人成功,奋斗和蓬勃发展,其中一些不会。这是一个有趣的时间,”他说。

别人看到一个类似的转变。负责市场营销的副总裁克里斯•琼斯Codasip指出,在这个不断增长的推动该改进,芯片正变得越来越专业,和更少的硅是被通用计算领域。

“然而,通用的决策与dedicated-task引擎或可编程加速器都归结为软件,”琼斯说。“总是会有一些情况的软件将运行在一个给定的芯片在很大程度上是未知的,如果软件负载是不确定的,芯片设计师所能做的就是提供一个健壮的通用计算平台性能纯粹是一个函数的核心频率和内存延迟。”

在光谱的另一端是软件运行的100%总是知道芯片tape-out之前,琼斯解释说,无论是安全卸载、传感、物理层通讯协议或一个推理算法。“在这种情况下,权衡成为硬连线逻辑与一个引擎优化任务。无限的时间和资源,一个硬连接的逻辑块运行一个单一的任务和更低的功率几乎总是会小于一个可编程的元素。然而,我们生活在一个世界里总有限制时间和人力,所以专门优化处理器很多意义。+可编程加速器提供修改后硅在软件的好处而不是芯片re-spins省钱和延长的寿命给定芯片设计如果标准进化。”


图1:定制的设计方法。来源:节奏

系统级问题
作为建筑必须做出权衡在系统层面上,架构师总是质疑是否使用特定于应用程序的硬件或有一定程度的可编程性,产品营销总监Prasad Saggurti说Synopsys对此。“根据市场的大小,你去一个定制的解决方案或一个更通用的解决方案。”

当一个工程团队可以选择一个完全定制的解决方案,钟摆可能稍微回通用在人工智能领域的应用。Saggurti指出,在某些细分市场像人工智能应用程序和嵌入式视觉,有某些类型的计算发生超过别人,因此,IP提供商拥有这些知识能够建立更专业和application-optimized构建块。例如,Synopsys对此逻辑库标准电池含有某些盖茨使嵌入式视觉处理器和人工智能机器学习为云处理器更小和更低的权力。“因为我们提供这些构建块,我们跟我们的客户-芯片设计者,看看他们是如何使用我们的图书馆和我们的记忆。我们看到有一些优化可以使他们的产品做得更好。在这个意义上,我们有一个特殊的HPC套件包括一群特殊的逻辑库细胞使这些人工智能实现较小和较低的权力。它仍然满足其性能要求,但最终在一个较低的权力实现。”

在芯片级,Saggurti指出有一个专门的电路和通用计算。“工程团队不是避免专用电路。他们将越来越多。如果有人做cryptocurrency芯片,有很多专门的电路运行在非常,非常低的电压。我们支持那些家伙使用very-low-voltage记忆和图书馆,特别是。但在其他时候,限制,我们可以穿上cryptocurrency芯片是不同的。人工智能芯片更复杂,需要大量的不同类型的记忆和库”。

简而言之,他说,有GPU的方法还有纯CPU的方法。对于AI来说,人是介于两者之间。cryptocurrency芯片,它完全是专门的硬件。”,它是特定于你是否做一个CNN引擎或推理或培训engine-those事情也有所不同,因为有人使用典型的DDR或HBM2或他们是否正在考虑使用GDDR,所有这些事情都是由系统架构需求。当然这是外部存储器,但他们也玩这个。它不影响片上存储器,但他们选择HBM,最后应用程序,以及是否这是一个推理引擎或神经网络CNN引擎,所有这些东西做出改变。”

不过,贝恩斯保持“通用计算本质上总是占主导地位的模式,和其他东西会消退,流动,起伏。一些获得一个稳定的位置和一个生态系统,与他们长大。”

事实是,架构今天从无线基带处理器应用到机器学习包括尽可能小的通用计算。最重要的是,有一个星座的专用卸载引擎使用自定义指令集,接口、内存子系统,等等,优化特定的或有限数量的算法,Codasip的琼斯说。“这一趋势是部分负责的强烈兴趣RISC-V作为一个平台。鉴于模块化体系结构和性质的标准扩展,用户可以创建处理器无关的逻辑。这提供了潜在的巨大的电能节约,因为它已被证明,自定义指令集可以从根本上减少循环计数的一段特殊的代码,允许用户运行核心频率要低得多,同时仍然保持所需的性能。”

所以是通用的计算仍然适用,因为定制解决方案的一些例子吗?说:“是的,它是,弗兰克Schirrmeister,高级组的产品管理和营销总监节奏。“这涉及到怎么去功能。”

在他的脑海中有七个方式可以做到这一点。“极端左派是将所有的纯,手动实现硬件。很多人仍然这样做,这就是你有特殊功能;这就是发生了分化。这就是你得到的所有分化实现。您可以使用特定的技术,你可以模拟/混合信号,在数字否则就十分困难了,你可以做各种各样的很酷的东西在纯硬件。在遥远的另一端是纯软件,通用计算。”

所以波继续循环。

有关的故事

自定义硬件蓬勃发展



留下一个回复


(注意:这个名字会显示公开)

Baidu