中文 英语

电源管理成为世界上最重要的问题

对权力的担忧正在影响着一切,而人工智能则使其复杂化。

受欢迎程度

从电视和机顶盒等消费类产品到大型数据中心,电源管理正成为各种应用的更大挑战,在这些应用中,冷却服务器机架以抵消散热影响的成本可能是巨大的。

几年前,低功耗设计主要应用于依赖电池的移动设备。从那时起,无论它是连接电池还是插头,它已经渗透到各种应用中,随着人工智能和几乎无处不在的传感器推动对更多处理的需求无处不在,这种情况只会变得更加明显。

在许多此类应用中,功率和成本是紧密联系在一起的。例如,在消费类设备中,低功率允许更小的外形尺寸,因为耗散的热量更少,电源也更小。这反过来意味着更低的成本。而在数据中心,冷却可以占到总能耗的30%到40%,因此任何功耗的降低都会提高数据中心的整体效率。

这反映在知识产权也可以用在这些系统中。“为低功耗设计的半导体IP采用了许多用于移动设备的设计技术,”该公司IP核产品营销高级总监Frank Ferro说Rambus.“这些包括电源孤岛,这样只有必要的电路才能运行给定的功能。时钟门控而且功率控制在整个设计中使用,再次限制非活动电路的功耗。还有其他技术,比如动态频率缩放允许设备根据工作负载“限制”性能以节省电力。较低的频率通常意味着较低的功耗。”

除了低功耗器件架构,选择正确的工艺节点和设计工具也很重要。“有一些流程节点变体的设备是为最低成本优化的电力消耗而且泄漏量小,”Ferro说。“低功耗流程节点与利用低功耗设计技术的设备架构相结合,将确保系统设计人员实现最低功耗。”

有什么不同
功率一直是设计中的一个因素,但它往往让位于性能和面积/成本。事实上,在过去十年的大部分时间里,对手机以外电源的主要关注主要涉及漏电流,这促使芯片制造商采用这种技术finFETs在16/14纳米,这是背后的主要驱动因素之一gate-all-around场效应晶体管在3海里。

戈德温·马本说:“从90nm一直到14nm,都是关于泄漏的,我们花了很多精力来解决这个问题。Synopsys对此科学家。“在当时的行业中,我们并没有真正关注动态功率,因为我们完全专注于泄漏。在14nm处,泄漏得到控制,但由于栅极电容的增加,动态功率占总功率的很大一部分。这就是动态力量真正占据主导地位的时候。最难解决的最大问题是如何测量动态功率。”

为了测量动态功率,需要好的矢量。“为了获得一组良好的向量,传统上发生的情况是,设计架构师会说,‘这是SoC将在系统中运行的五到六种场景。选择这五到六个,在此基础上进行功率分析,或者取其平均值,’”Maben说。“这些都是用来衡量权力的方式。但今天,这还不足以满足电力需求。在这里,基于仿真的功率分析变得至关重要,因为现在当您将SoC放在模拟器上时,您就拥有了整个系统。你甚至可以拥有一个完整的软件堆栈。你可以运行一个应用程序,让你的SoC处于正确的模式,因为这是你的芯片在某些应用程序中运行的方式。这个特殊应用的矢量将被用来测量功率。”

然而,使用这种方法可能会有问题。运行一个应用程序的一秒钟会生成数十亿个周期的数据,因为它会捕获有关时钟频率的所有信息,例如,时钟频率大于1GHz。“有数十亿个周期,这意味着有1tb的数据,这一点用都没有,因为任何工具都很难处理这么多的数据。因此,我们投入了大量精力来获得整个时间窗口内的关键区域,这对电力是有好处的。”

这里的行业工作主要是为了确定要测量的正确向量,以便同样的向量也可以用于优化。EDA供应商和芯片制造商正试图确定如何最好地解决这个问题,因为动态功率是许多新设计的瓶颈。

目前,最好的方法是使用仿真来执行设计的功率分析,因为仿真器具有完整的SoC在RTL在级别上,基于电源配置文件应该更容易识别感兴趣的窗口。这种方法确实需要更成熟的RTL才能开始,这就是为什么工程团队又开始使用RTL勘探技术。

Maben说:“在RTL的早期阶段,有一些工具可以深入了解功率分配情况,并为设计师提供如何改进RTL结构或微架构以降低功率的指导。”“在当时,130纳米之前的RTL估计/RTL探测是一件大事,一旦我们转向关注泄漏,它就退步了。现在我们又回到了这个问题。RTL探索不仅仅是为了能量。这是为了时间安排和楼层规划,以及早期决策。例如,在RTL探索过程中,我是否能够着眼于物理方面去创造一个更好的RTL?”

随着所有这些努力都投入到RTL的探索中,很快就会有新的工具帮助设计师不仅从功率的角度探索RTL,还可以从时间、空间规划和其他一些任务的角度来探索RTL。

当今新芯片(包括所有人工智能主导的芯片和soc)的另一个动态动力是故障。Maben称这是目前出现的最大的新问题。“故障功率,因为人工智能芯片纯粹是算术和数据路径组件,占总动态功率的很大一部分。这是设计师和EDA供应商试图解决的一个领域,但它相当复杂;测量故障并不容易。”

故障有两种类型:功能性故障和时序故障。他解释说:“为了测量故障,延迟很重要,因为每个门的输入到达时间是测量的关键组成部分。”“如果信号到达时间之间的增量大于或小于栅极的传播延迟,则存在故障。在RTL阶段,没有与之相关的延迟;没有物理信息,所以我们如何量化它?这就是使用物理信息进行RTL探索变得至关重要的地方,如果我们指出故障的来源,用户可以从体系结构的角度进行某些更改,以最小化故障。”

在人工智能或基于数学的设计中,故障占总功率的30%,虽然目前还没有任何工具可以自动优化故障,但至少可以使用一些商业工具来帮助测量故障。

这是问题的一部分。虽然电源在每个节点上仍然是一个问题,但在较小的节点上,管理功耗和电源噪声尤其麻烦,因为这些节点的容差要严格得多,余量也越来越有限。

PowerArtist产品管理主管Preeti Gupta表示:“在7nm finFET节点上,更高的器件电容、互连电阻和电流密度强调了动态电源和热管理的重要性有限元分析软件.通过采用可预测和可靠的RTL方法,您可以在过程早期识别和修复潜在的电力问题,并做出更好的设计决策。”

Gupta强调,RTL电源分析通过提供更直观的环境来识别、调试和修复潜在的电源问题,可以在设计流程的早期做出高影响的电源相关决策。与综合设计和计算门级功率需要几个小时相比,RTL功率分析可以在几分钟内完成。她说:“在RTL中模拟设计活动以获得高覆盖率也容易得多。”“所有这些优点都允许您探索多种架构,以便在各种操作模式下做出最佳设计决策。通过严格跟踪不同带宽场景下的RTL功耗,AMD公开表示他们如何在高性能计算设计应用程序中降低了70%的功耗。”

人工智能改变了游戏规则
虽然功率在越来越多的应用中很重要,但它是AI/ML芯片的主要限制因素。

马本说:“人们想说的是,时机永远是首要因素。”“但现在,考虑到功率是一个限制因素,设计师们在问他们是否可以用功率来交换时间,因为即使他们达到了频率目标,在这样的功率下,他们将无法使用芯片。他说,如果我想把功率降低10%,我能得到的频率不是5GHz,而是多少?“这是因为功率的增加会导致热失控,然后温度的升高会要求性能减慢。”如果你观察任何工具,它总是计时,计时,计时。没有什么好办法能说,‘忽略时机,降低功率’,因为从来就不是这样。然而,对于人工智能设计,功率确实是限制因素,所以每个人都在说,给定这个功率,我能达到的最大频率是多少?以前,它常常是,‘这是我的设计和频率。它消耗多少能量?’现在,情况正好相反:‘这就是我正在寻找的力量。 What’s the max frequency I can reach?’ This is key because some of the chips I’m looking at are a few hundred watts.”

人工智能的出现正在创造设计机会,从更好的消费产品用户体验到工厂车间的自动化质量控制。人工智能驱动的用例正在呈指数级增长。驱动这些设备的性能能力是由创新的信号处理和机器学习(毫升)技术。

Dipti Vachani,高级副总裁兼汽车与物联网总经理手臂他说,对于受功率、成本和大小限制的物联网和嵌入式应用,真正的重点应该是计算效率,而不是计算性能。这意味着芯片架构需要紧密地映射到目标应用程序的整体需求,最小化硅面积和器件成本。她说,这对硅设计师提出了一个挑战,他们的目标是将他们的微控制器与最大的智能水平区分开来。

在这一点上,Arm宣布了其人工智能平台的重大增加,包括新的机器学习IP和用于Cortex-M55处理器的神经处理单元协处理器,该公司声称可以将ML性能提高480X。

此外,随着物联网和边缘技术与人工智能的进步和5G的推出相交叉,更多的设备上智能将推动更小、更智能、更有能力,但对成本高度敏感的设备的创造。Vachani表示,在从头开始安全设计的微控制器上提供这种智能,将降低芯片和开发成本,并加快设备上DSP和ML功能的上市时间。

如果你建好了,他们会来吗?
Synopsys的Maben说,这个问题的真正关键在于电容和设计师采用新技术的意愿。

他说:“我们试图在合成阶段早期观察电容,并试图根据物理信息进行一些逻辑重组。”“例如,如果我观察切换速率和电容,如果网长或短,也许我们可以将网提升到更高的层,或者我们可以将空间翻倍。我们可以用双倍宽度。有很多新东西,但归根结底,这是从电源的角度有效地管理电容。”

最大的问题是,设计工程师何时,甚至是否会采用新技术来解决这些问题。“我需要进行功能验证吗?这将增加我的完整周期的磁带?例如,对于进行电源门控的人来说,最大的影响是在RTL级别进行功能验证。我的模拟或功能验证窗口周期将长得多,这与我们通常做的事情有偏差。因此,如果我们提供的技术不会纯粹影响实现周期的功能,那么只要它是自动的,人们就愿意采用,并且像逻辑等价性检查这样的验证是可能的,以确保无论在功能上验证的是什么,实际上都等效于门。如果一项新技术要求你跳出正常的周期,单独验证,那么人们就不愿意采用它。”

最后,Maben指出了另一种可能的漏电解决方案。即使它在14nm及以下的控制下,它仍然代表了总功率的很大一部分。

“工程团队现在说,‘我在做电源门控,我在做多电压。我还能做些什么来减少泄漏吗?这就是我们开始研究n井设计的地方。通常情况下,大部分时间都是开着的。即使你说有电源门控,n井还是开着的。现在,人们试着看看是否能关闭N-well。这导致了一个新的领域,这是一个分裂和合并的n阱设计。在那里,你需要有一种方法来解决有一个逻辑和一个完全断电的问题,它也有N-well断电。如果我有一个一直开的逻辑,也就是N-well一直开,当你试图把两个逻辑放在一起时,有不同的N-well,潜在的问题,比如N-well间隔就会出现。为了解决这个问题,人们经常会看到被称为绝缘缓冲器和绝缘逆变器的新电池被设计出来。 Here, designers started designing insulated cells, called split N-well cells, where each individual cell will have two N-wells. So if I’m trying to optimize a logic going from always on N-well through a shutdown N-well, then I need these special cells, which will isolate these two N-wells. We are seeing many engineering teams already using these in order to squeeze out the last bit of leakage,” he said.



1评论

凯文·卡梅隆 说:

现在问题更大的原因是,随着扩展的结束,我们需要做3D ic,而旧的性能方法(英特尔)太耗电了。

留下回复


(注:此名称将公开显示)

Baidu