中文 英语

权力现在成为更多市场的首要关注

在以性能为主要目标的市场中,设计人员不再把功率和性能作为一组单独的要求来考虑。

受欢迎程度

在传统上存在显著差距的市场上,对能源和电源效率的担忧正变得与性能同样重要,这为芯片架构和ic设计方式的重大转变奠定了基础。

这种转变可以在越来越多的应用程序和垂直领域中看到。其中包括移动设备和数据中心,移动设备的电池充电时间预计会更长,而数据中心服务器机架的供电和冷却成本持续上升。不过,与过去不同的是,实现这些目标没有单一的最佳方法,过去被认为过于昂贵或难以实施的方法现在正在重新审查。简单地说,所有的选择都摆在桌面上,新的选择正在开发中。

“在移动领域,下一代所需要的性能还没有结束的迹象,”史蒂文·吴(Steven Woo)说Rambus.“低功率空间是关于保持信号完整性,达到所需的性能水平,同时提高电源效率。我们看到很多概念,以前是在一种类型的内存或一个空间中使用,现在在许多不同类型的市场中使用。利用多渠道就是一个很好的例子。虽然低功耗工程师们主要是从省电和保持在一定功率范围内的角度来研究它的,但他们也在质疑哪些概念可以借鉴到其他类型的存储器上。”

例如,纠错正变得越来越复杂,对这类技术的需求也越来越大。Woo说:“都是通过链接上下移动,内存设备本身作为进程的几何形状变得越来越小。”“这意味着干扰类型的影响正在挑战设备的可靠性。因此,在存储设备内部还有更多的事情要做,并试图弥补更具挑战性的可靠性要求。”

对于包含CPU和GPU的笔记本电脑来说,随着功耗的增加,温度会上升,一旦超过某个阈值,性能就会下降。“功率、热量和性能是紧密联系在一起的。如果设计不考虑电源效率,gpu或cpu的运行速度就会变慢,”英特尔的产品管理总监普雷蒂·古普塔说有限元分析软件

这对体系结构决策有直接影响。“在建筑上,过去的设计团队采取了各种各样的方法功率控制在早期,决定需要多少不同的电源,何时可以关闭电源,动态频率缩放等等。这些技术是众所周知的,设计团队越来越多地应用它们,”她说。

权力的影响在设计中无处不在。“我们把权力视为一个数字,”罗博•艾特肯(Rob Aitken)说手臂研究小组。“我们把它看作是一个核心、芯片或封装消耗了多少瓦。不计功耗,创造尽可能快的技术的时代已经一去不复返了。然而,这意味着功率通常被降级为设计中的次要约束,而不是需要优化的东西。但是为了达到最高的性能水平,我们必须把动力传递作为性能的另一面。从物理上讲,计算需要充电和放电电容,而更快地进行计算需要一个充电源,以及在需要的时候在需要的地方传递它的能力。这反过来又需要理解的动态行为电力输送网络,它的感应特性,它的电容存储及其与逻辑的距离,在网络中传播的波的频率特性,等等。电路的电力网络就像制造商的供应链。如果充电延迟,一切都会变慢。这些物理限制就是为什么后置动力传输等创新技术越来越受欢迎,我们正在寻找同时最大化动力传输和逻辑性能的方法。”

数据中心的能源效率
在数据中心内部,由于服务器的供电和冷却机架的成本,电力一直是一个令人担忧的问题。人们的注意力也逐渐转向了能源效率。谷歌、亚马逊(Amazon)和Facebook等大型系统公司一直在设计自己的芯片,以提高效率,紧密集成软件并添加自定义加速器,以确保几乎每个计算周期都针对特定的工作负载进行了优化。

该公司系统架构高级总监Piyush Sancheti表示:“这是功率与性能的对比,或者是每毫瓦的兆赫Synopsys对此.“这就是他们所追求的约束条件。它不再是你只追求性能而在过程的最后担心功率的情况。这是一个内置的约束。它从架构开始,一直到设计、实现和收尾。”


图1:低功耗设计流程。来源:Synopsys对此

桑切蒂指出了这种情况发生变化的几个原因。“数据中心是电子生态系统中最大的能源消费者之一,因此在宏观层面上存在限制。他们试图将整体能源消耗控制在一定限度以下。虽然有绿色倡议在发挥作用,但在芯片层面,它本质上是一个限制规模。对他们来说,这不仅关乎性能,还关乎芯片的大小。在那里,能源效率在冷却芯片的能力中起着作用,因此有加热、冷却和封装方面的考虑。此外,电源完整性是由功耗驱动的,但所有这些问题都影响到性能。”

热是另一个需要考虑的因素。芯片运行得越快,消耗的能量就越多,温度也就越高。在高级节点上,由于在给定区域内封装了比以前的节点更多的晶体管,这就造成了冷却方面的挑战。

在过去,这是通过在设计中添加边距来解决的。但guard-banding增加了功耗并降低了性能,因为信号需要传播得更远,并且需要更多的能量才能将这些信号驱动到更远的距离并通过越来越细的电线。

Sancheti指出:“这些保护带不再是一个可行的选择,因为我们的运行电压接近阈值电压,所以我们不能在优化性能的同时保护电源。”“出于这些原因,我们开始看到几乎每一个HPC数据中心用户都将功率和性能作为队列来看待,而不是针对其中一个进行优化。”

虽然对性能的需求不断上升,但对能源和电力效率的需求也是同样重要的考虑因素。

“数据中心正在以前所未有的方式处理数据,汽车配备了多层次的电子设备,物联网正在使家庭和电器更加智能,”该公司首席技术营销工程师穆罕默德·法哈德(Mohammed Fahad)表示西门子EDA.“在过去的几年里,所有这些都使电力成为一个突出的、一流的衡量标准。十年前,在各种客户的CAD流程中甚至不存在一些功率方法。在过去的10年里,我们见证了对强大功率方法的需求不断增长,这些方法可以无缝集成,与工具链的其他部分轻松互操作,不仅有助于估算功率,还有助于优化功率。”

内存的变化
所有这些变化也对内存架构产生了影响。Synopsys的产品营销经理斯科特·达兰特(Scott Durrant)指出数据中心在美国,所消耗的能量和系统产生的热量已经达到了风冷系统所能耗散的极限。“因此,数据中心经理正在寻找能够减少能耗的解决方案,从而减少必须从建筑物中移除的热量。”

减少数据移动有助于提高效率,无论是在芯片内、包内、机架中的服务器之间,还是在服务器和存储器之间。

“对他们来说,最大限度地减少必须发生的数据移动量变得非常重要,”杜兰特说。“他们解决这个问题的方法之一是拥有本地化或分布式计算能力。数据处理单元是一种用于在网络内部或存储内部实现计算的芯片类型的例子,这样您就不必将所有东西都移动到计算服务器来处理那里的数据,然后再移动回来。这是在宏观尺度和微观尺度上实现的,我们看到这种能力被实现为特定于应用程序的或优化的设备,这些设备在数据驻留的地方或经过的时候对数据进行操作,而不是为了这些类型的操作而专门移动数据。”

使用先进的包装,由于需要最小化所需的数据移动量,增加了另一种选择。“如果你可以在一个先进的软件包中包含大量的处理能力,那么你就可以将数据移动到毫米而不是米。这对数据传输所需的能量有很大的影响。”

使用这些技术中的任何一种,最终目标都是继续提高数据处理性能,同时将能源消耗保持在当前水平。

电力与能源
同样,为了设计高效的系统,设计师们现在同时关注电力和能源。功率是执行特定任务所消耗的总能量,但这两个定义经常混淆。

“当有人提到电力时,我总是会问他们是指电力还是能源,”英国石油公司IP集团的产品营销总监乔治·沃尔(George Wall)说节奏.“能量等于能量乘以时间。能量通常是由电池或电表告诉客户的。能量是功率和系统性能的结合。所以功率和性能都会影响能量。低功耗、低性能的解决方案实际上可能不如高性能、高功耗的解决方案节能。假设你可以执行一项任务,功率是1毫瓦。如果下一个解决方案需要增加20%的功率,即1.2毫瓦,但它可以以两倍的速度完成任务,在这种情况下,更高性能、更高功率的解决方案将更好地提供能量。”

这在不同的应用程序中成为一个复杂的平衡行为。西门子EDA的Fahad说:“能量需求随着特定应用程序的运行时间而变化,例如在智能手机上运行一分钟的‘极速游戏’所需的能量可能与拨打一个小时的语音电话相同。”“这意味着需要对特定场景的功率和能量进行评估。这有助于用户洞察设计或重新设计架构/算法,以便在允许的电力/能源预算内管理相同的操作。”

在更高级的设计中,它变得更加复杂。例如,整体效率的一个重要方面是故障功率,这给芯片设计人员带来了新的焦虑。“有时故障功率与总功率的比例可能高达50%,”法哈德说。“这完全是对运行系统的可用能量的滥用。在这里,能力评估工具可以提供帮助,因为它们可以生成与设计的功率和能源消耗相关的各种指标。直到最后一分钟才解决电源问题可能会导致后续问题,如热自热、电池电量溢出、包装问题等。”

虽然根本问题没有改变,但选择的数量却在增加。Cadence IP集团的产品营销总监Prakash Madhvapathy表示:“如果你能在比之前的解决方案更短的时间内完成同样的任务,即使能量水平略高,整体动态能源消耗也会降低。”“与性能较低的dsp相比,高性能dsp在一小部分周期内完成一项任务。当他们这样做时,总的动态能量消耗实际上下降了很多。”

确定最佳方法在很大程度上取决于工作负载。例如,在音频和视觉领域,不同的工作负载现在摆在桌面上,包括传统的DSP信号处理算法,以及人工智能和机器学习正在成为焦点。

Madhvapathy解释说:“大多数算法现在都从纯粹的传统DSP类型转向更多的AI和ML。“使用的数据类型是不同的。它们与你在以前使用的DSP算法中发现的不一样。这意味着我们必须适应这些类型的工作负载和这些类型的操作员类型。当我们这样做的时候,我们必须小心,不要增加太多的能源消耗,以至于我们为了额外的性能放弃了太多。”

静态能耗尤其值得关注。他说:“现在的技术面积更大,技术节点越低,静态能耗越高。”“静态能量只不过是浪费的能量。当你什么都不做的时候,设备开着,但你没有使用它,它仍然在消耗静态能量。你必须平衡静态能量和动态能量。对于耳机等设备中的关键字识别应用,电池非常小,必须以节能的方式实现。我们确保通过添加少量的新指令,我们能够在特定任务中实现更高的性能。”

随着新的体系结构特性的添加,这变得非常复杂,例如机器学习.他说:“你有一个权重位于主存储器中的网络,你必须将其获取到DSP,然后对其进行操作。”“即使你设计的DSP在运行算法时能量非常低,如果你从主存中提取到总线上消耗太多能量,你将放弃所有的节能。你必须找出系统中能量消耗占主导地位的地方,然后在这个领域工作。除了技术部分,它还需要建筑特征,以确保我们保持非常低的整体能耗。”Madhvapathy指出。

Wall指出,权衡可以包括内存带宽需求、性能需求和功耗需求等方面的考虑。“就像历史上的许多架构权衡都是在性能与面积之间进行的一样,它们也必须进行类似的权衡——性能与功耗,以及系统的功耗,而不仅仅是系统的一小部分。这是整个系统访问主存的能力,而不是访问更多的本地化资源。这些都是影响系统整体力量的因素。”

将离开
为了使设计更有效,需要在设计早期解决这些问题。Ansys的Gupta说:“现在的范式转变是,公司正在关注真实的用例,并试图弄清楚对于这些长期的真实用例,我是否真的节省了电力。”“当我们说‘真实用例’时,我们指的是数据的视频帧、启动序列或后硅测量。为什么我们不能在一开始就进行模拟,然后做出早期的设计决策?”

模拟是通过硬件模拟启用的,硬件模拟用于这些长时间运行。

她解释说:“软件模拟器在运行很长的场景时会失去动力,因此,硬件模拟器盒可以生成这些真实的应用场景。”“但这只是一部分。另一部分是如何利用这些长时间的场景,也就是数百gb或tb的数据,以一种合理的方式消耗它们,从而在早期就可以做出这些架构决策。半导体设计行业的目标应该是如何预先完成这种模拟。我们都在谈论左Shift和设计的早期可见性。这应该有助于设计决策。”

这些问题也为工程团队带来了许多新的问题和关注。

“我的设计中有X个功率域。在物理设计和物理实现过程中,我为拥有这些独立的权力域付出了沉重的代价。我真的需要那么多吗?我是不是太过分了?或者我是否面临热节流挑战的风险?幂域的正确数量是多少?’所有这些都得益于早期的反馈。”

如果考虑的数据涉及后硅测量,如何告知当前正在进行的设计?

这就是基于软件模拟的方法发挥作用的地方,她说。“假设你很早就有了RTL设计描述。你有RTL设计描述,你通过硬件模拟器推动它,你在几个小时内就能得到一个真实的用例。你拿这个真实的用例,然后分析这数十亿个循环的热效应。然后,需要一个快速的热求解器,以及一种快速的方式来引入该活动来创建热图,以查看“也许我需要将这部分逻辑移动到那部分,以便更好地分配热量。”’或者,‘我需要在这些不同的位置安装传感器,这样我就知道在哪里抑制性能。’”

优化是关键
随着设计变得越来越异构,每个组件都需要查看。

Rambus的Woo问道:“由于dram都是基于相同的基本电池技术,那么如何优化它周围的所有其他东西呢?”“如何优化低功耗环境?如何针对高性能环境进行优化?如果你在20年前问我,我会说,‘我们不太担心权力。功率不是我所说的一流设计约束,所以你可以用不同的方式优化。但现在我们看到,功率实际上已经成为一个一流的设计限制。马上,第一个想法就是,‘如果权力对我来说是一个很大的限制,那么也许我应该看看低权力专家们一直在做什么,因为这就是他们从一开始就在优化的地方。”

Durrant指出,开发高端设备非常复杂,也非常昂贵,因此提前建模变得越来越重要。

Sancheti同意了。“如果你从历史上看高性能计算数据中心市场,他们的上市时间是以年为单位的。如今,由于竞争环境如此激烈,他们现在开始考虑像过去的经典SoC公司那样设计芯片。所有这些都增加了另一层复杂性。今天的设计和芯片更饥渴,速度更快,并且不得不与不断缩短的时间表作斗争。正因为如此,流程的所有方面——从软件到仿真再到实际架构和前端设计——都需要有一个功能和性能的概念。”

这意味着当工程团队在研究功率分析和优化设计时,他们会考虑工作负载来自哪里,以及需要运行哪些场景来进行功率分析和优化。但如何实现这一目标,并没有唯一的最佳答案。

根据sanchetti的说法,软件在这里扮演着重要的角色,因为从系统的角度来看,真正的工作负载或场景是由软件应用程序以及电源管理软件如何与其他硬件交互决定的。

与此同时,优化必须在设计流程中尽早发生,这样才能产生影响。法赫德说:“传统上,权力被估计在大门层面,但到那时,几乎不可能控制它。”这促使设计人员寻找有助于在RTL级别早期评估和优化功率的方法,所有这些都需要左移位方法。尽管RTL级别的功率估计可以使逻辑重新设计变得简单和快速,但由于在设计的初始阶段缺乏实现级别的细节(如寄生数据),它仍然存在一定程度的不准确性。事实上,设计师有时更感兴趣的是在设计早期阶段的功率数趋势,而不是非常精确地测量它们。随着设计在周期中逐渐成熟,越来越多的信息开始出现,迭代功率分析使得在不影响项目进度的情况下更有效地关闭电源成为可能。除了准确之外,功率估计也必须是现实的,这就是我们通过在模拟器上运行的真实场景来增加软件驱动的功率分析的原因。”

其他人也同意。”模拟已经变成了一个桥梁,”桑切蒂说。“通过快速仿真系统,你可以引入软件将要执行的真实场景或工作负载,然后你想要在这些工作负载的上下文中查看性能和功率。架构定义也是一样的。当你观察系统的吞吐量时,它不能仅仅是吞吐量。同样,它必须考虑到在特定的功率范围或特定架构的能效目标下,吞吐量可以维持多少。”



留下回复


(注:此名称将公开显示)

Baidu