更多的选择,更少的黑硅

解集的逐渐减少,摩尔定律已经改变了一切。

受欢迎程度

芯片制造商也开始重新审视应该使用多少黑硅在异构系统中,效果最好,和什么替代品可用——放缓摩尔定律的直接结果缩放和soc解集的增加。

的概念黑硅已经存在好几年,但它真的开始起飞的介绍吗物联网,当一切都适合在一个死亡和工作从一个小电池。证明问题的初始版本的智能手表和手机,和最好的解决方案就是关闭每一个电路不需要一个重要的应用程序。

其他问题。例如,侵入电流驱动的备份设备时,特别是那些需要更快地打开,可以压力回路,他们会损坏芯片。所以当电源关闭部分芯片可以减少老化——把他们很快也会有问题。大部分是通过工程解决过去十年的低功耗芯片,和暗硅加上极其高效的设计使整整一代的有用的移动设备,同时也将显著降低数据中心的能源账单。

现在的问题是下一步该做什么延长之间的时间费用,并添加更多的黑硅并不能解决这个问题。相反,有更多的专注于设计硅适合应用程序,这是由一系列的发展使整个设计到制造流程。其中包括:

  • 整个生态系统发展先进的包装,提供从更好的设计工具,离散的组件(如chiplets,以及不同的包装方法证明在硅OSATs和铸造厂。这使得芯片制造商开发更复杂的设备,同时分区和优先领域特定应用程序更有效。
  • 先进的包装有打开短信号路径和更快的互联方式。信号可能会减少出行距离比大平面死在一个包,这些信号可以使用更少的权力使他们加快利用先进的互联和新材料。
  • 超低功耗设计和各种各样的功能,在很大程度上离场观望,如近门槛计算,得到更广泛的关注。此外,在过去的十年里,里面的密度的电池增加了平均每年5%到6%,允许设备做更多相同的大小或更小的电池。虽然形式因素的终端设备往往是相对一致,更可以装在一个设备在不影响电池寿命。

所有的这些变化是附加的。所以大部分芯片的驱动,更可以用更小的芯片或chiplets,可以更多的成本和功耗。此外,各种功能在芯片可以开发最优流程节点,权衡成本等因素,用例,静态电流泄漏,和大小。

“有更多的不同的方法,”罗伯•艾特肯表示,研发研究员手臂。“黑硅背后的想法是有一个固定的功率预算,尤其是对移动计算。但是如果你缩小设备,同时推动频率,那么权力没有得到改善。相反,你结束了这个空间,有各种关于如何处理。”

对于智能手机和衣物,黑硅是一种行之有效的解决方案,但这并不是最有效的。还有其他选择,从限制各种组件传播他们的大小在一个包,它可以降低热影响密度增加。这是特别有价值的记忆,在冷温度下更有效地运行。所以内存可能保持冷静当附近的电路断电,但侵入电流很快就会过热。一个更好的选择是物理上独立的内存从活跃的逻辑一个高级包。

“如果太接近最大允许的操作温度范围,您可能需要刷新记忆更多,”史蒂文说哇,研究员、著名的发明家Rambus。“你最终失去性能变热。如果它变得温暖,你可能要做所谓的节流。也许你不运行它的峰值性能在较长一段时间,或者你必须在短时间运行它,让它冷却了。”

所有这些技术,允许移动设备和其他发展比过去更密集的计算没有燃烧起来。“在移动领域,实际上上升了,”艾特肯说。“今天芯片画更多的权力比15年前。一些是有可能的,因为更好的电池技术。但是有些更多的物理区域,可以让你更有效地分散热量。”

通过隔离芯片的各个部分规划和使用各种技术,如三维地板动态电压频率扩展,还有一些黑硅,热量可以更有效地管理。也可以通过使用硅面积更少,提高了性能和开门额外的功能和特性相同的设备。

这种方法还有其他好处。过去“有原因去越来越大的芯片,所以你可以有更多的功能集成到一个芯片上,”罗兰Jancke说,设计方法论的头弗劳恩霍夫IIS的自适应系统分部工程。“如果你不需要某些部分硅,然后你可以关掉他们节省电力。但是还有其他的原因使用更小的芯片。如果包括模拟设计,例如,通常是在一个老比数字流程节点,因此占用更多的区域(这使得它更有利于减少数字组件的大小)。在射频的情况下,它需要大量的电力。有一个chiplets安全优势,。很难复制整个系统功能。它只能如果你同一块以同样的方式集成到同一个包。如果你失败了,其中任何一个芯片,然后你错过了整体功能。”

人工智能的影响
的一大驱动程序重新思考什么,多久,包括人工智能,机器学习,芯片是专为最大的性能和吞吐量。特别是大型数据中心,需要处理大量的数据非常快。通常,这涉及到强大的处理器核心并行工作,其中一些专门为这些数据中心的工作负载,通常结合gpu, cpu,某些类型的转专业,和需求方。问题是这些设备依靠源源不断的数据,并且流并不总是一致。

“如果有两个解决方案,一个更有效地使用晶体管,它将获得更多的吞吐量/美元每瓦,“说杰夫•泰特的首席执行官Flex Logix。“所以有黑硅不可取的从客户的观点。很难开发架构,高利用率,但利用率得到越多,越好。晶体管仍然不自由——尤其是在供应短缺。”

泰特指出,最好的看法已经改变了过去五年里,随着人工智能越来越普遍。“在AI的早期阶段,第一个挑战就是得到工作和改进模型——让他们越来越好,学习曲线,”他说。“数据中心,他们有巨大的预算和巨额利润,使他们做他们不能做某些事情。但是我们看人工智能部署到大容量,对价格更敏感的解决方案,客户要找谁能提供最推理性能功率预算和预算他们的钱,大多数人,我们看到了功率预算之前预算他们的钱。这不仅仅是关于使用晶体管有效成本原因。晶体管越多,越漏。如果你可以用更少的晶体管完成工作,这将是更省电。”

在人工智能世界中,“黑硅”可以在另一个内涵,。“尽管供应商正试图给你所有的硅和马力,当你试图运行实际的神经网络模型,你甚至没有得到接近40%的系统,”尼克倪,数据中心的人工智能和计算市场高级总监AMD。“引擎可以非常快的,但如果你没有处理的数据,然后他们只是闲置。这就是导致暗硅。”


图1:AMD的3 d V-Cache使用缓存chiplets堆放在一个处理器。来源:AMD

挑战在于彻底理解上下文和需要处理的数据量,然后设计芯片在这些因素。AMD收购Xilinx的原因之一,为什么英特尔收购了阿尔特拉,是能够调整如何使用这些设备。可编程序逻辑可以根据需要动态重新配置和大小的,所以不是一个巨大的FPGA,小FPGA可以分散在一个包并根据需要使用。当一个巨大的FPGA从来不是一样有效的ASIC,更小的可编程逻辑芯片可用于收缩或不可利用硅利用率低下的数量。

”,最好是能够构建一个定制的ASIC为每个市场,这些用例是如此不同,市场变得越来越小,而构建一个ASIC的成本上升,“说Rambus吸引。“所以一个FPGA与x86是有意义的。你在申请你的着工作负载,然后利用x86的共同基础设施做的一切。”

chiplet因素
Chiplets添加另一个级别的灵活性,因为模具尺寸可以调整任何所需的特定功能。这意味着死亡的未使用部分可以完全被消除,而不是把睡觉,可以穿上不同的chiplet添加功能。

“死大小的主要因素之一的采用chiplets,”Jan Vardaman表示TechSearch总统,在最近的一次演讲。“死尺寸巨大的gpu和cpu,今天,我们必须有更多的晶体管。只是我们必须找出如何在经济上把所有这些晶体管和功能。所以我们做额外的工作在推动采用chiplets会让我们做一个更好的方案更高的密度。你可以做事情提高功率效率,这是非常重要的在我们的很多应用程序。”

关键是能够把在最有效的方式。“我们必须能够想到的设计以一种新的方式。这是一个系统架构,”Vardaman说。“因为你得到一个更小的死,给你带来改善,你会使用最先进的节点的部分需要这些节点。你不会制造的模拟部分死在一个高性能的逻辑节点。你要工厂其他节点,因为它是更便宜。你要把所有的在一起。IP块chiplet是困难。它必须是co-optimized。所有的东西一起工作。 You can’t design these things in isolation.”

在这个场景中,黑硅还原能力,成为一个选择,不一定是最好的。虽然它可能为特定功能提供计算能力储备,这不是最有效的方法来设计一个复杂的系统。

结论
能够把更多的功能通过功能收缩持续到死,但力量和性能优势缩小,。因此,芯片制造商正在寻求先进的包装这些好处,和黑硅的吸引力在一个包比一个高性能的死,一刀切,卷在billion-chip范围。即使在最理想的条件下,黑硅似乎显示出它的年龄。

“我们在这个暗硅轨迹,”艾特肯说。“有一堆东西进了黑硅成为主流思维过程,和每个人都承认。您将构建一个芯片,有很多不同的核心能力,其中一些会在不同时期,其中一些温暖。这就是好。但你如何打开一切所有的时间去完全最大化计算性能仍然是一个非常困难的问题。这是一个你可能不想回答,因为它会产生大量的热量,你不能处理,无论如何。”



留下一个回复


(注意:这个名字会显示公开)

Baidu