整体功率降低

最小化功率、能量或热影响需要一个一致的方法在整个设计、开发和实现流程。

受欢迎程度

设备的能耗是影响设计的每个阶段,开发和实施的过程,但识别机会节省电力不再可以使硬件更有效率。

工具和方法到位的节能机会,从RTL实现,部分半导体行业已经使用它们。都被认为是成熟的,所以标准定义权力意图。

巨大的机会仍然存在额外的电力和能源节约,但其中许多涉及质疑系统级决策世世代代盲目地接受和许多实现节点。其中的一些决策需要重新考虑,因为他们是防止建造更大、更复杂的设计。

”有三个骑兵混合-电力、能源、和热,”罗伯Knoth说,产品管理总监在数字和验收小组节奏。“他们一直都存在,权力可能是最突出的,但能源已站到了最前沿在过去的几年里。现在我们看到热出现。他们都是有趣的,因为你可以攻击他们在特定的点在你流与特定的工具。”

这就带来了一个问题。“建筑师的困境是,你需要低级信息做出初步估计,”Frank Schirrmeister说解决方案和业务发展副总裁Arteris IP。“这困境从未得到解决,可能不会在我的生意的一生中得到解决。为了尽早做出架构决策,我们需要一组信息,一组工具,和一组能力来支持这些决定。我们需要尽早这些决定,但他们也需要尽可能准确地反映了实施效果。”

添加,权力不能作为一个数字。有些人担心总能量,因为这可能会影响电池寿命。其他人则更关心峰值功率,因为会导致芯片上的操作问题,或能力随着时间的推移,这可能会产生热的问题。

分析,你需要确切地知道该系统是如何被使用。“想象一下你有一个SoC与100年不同的块,“说Ninad Huilgol, Innergy系统的创始人兼首席执行官。“他们一起互动,你不知道他们会事先产生一个峰值功率密度。当你有一个模拟运行,他们一起互动突然产生一个峰值功率密度。”

各种市场侧重于不同的方面。“边缘AI或边缘智力,有不同的care-abouts和不同的问题比一个数据中心超大型compute-type应用程序中,“节奏的Knoth说。然而,“他们两人会推动技术的某些方面,其中一些相辅相成的,其中一些是分开的。边缘会更关心某些方面的能量,因为电池寿命。和它是至关重要的考虑你在软件运行与你在硬件中运行。你回到你的通信基站的运行并发回给你吗?有一些非常棘手的问题,物联网产业独特的适合领导和创新。这并不意味着他们是唯一的领袖。人发展大型超大型计算数据中心主要在一个完全不同的类。经常,他们最努力的,因为你看所需基础设施的大量美元计算领域。”

RTL和实现技术
节电技术已经应用于RTL和实现水平数年,但可能有进一步的电力和能源节约。在实现水平,新技术是增加的问题,如果不解决,将导致权力被浪费。

”技术共同使它更难以可靠的电源电压,”马克说Swinnen产品营销主管有限元分析软件。”你会有电压降,人们经常只是建立在一个,说我可能会看到100毫伏下降。我的时间然后假设每一个细胞都可能是慢得多。显然不是每个细胞是最大压降会看到,所以你可以更准确模型实际的电压降,更准确的说你可以设计你的配电网络为了避免这个错误,你可以从这个电压降。你想利润率下降,可以产生巨大的影响。”

RT水平,时钟门控功率控制已经应用了很长一段时间。优化时定义的电力和能源相关的任务,他们什么都不做来帮助识别如果任务最优的正在执行的函数。

“我们有一个术语叫理想的力量,”Knoth说。“这是一个试图识别浪费活动。例如,如果你有一块运行的时钟是免费的,实际上在重置,你可以封闭的时钟。我们可以分析里想的切换块,加起来的力量由于这些切换从层次结构,然后显示这些在一份报告中显示,权力都被浪费了。使用这种方法,我们看到硬件工程师从设计方法论的角度改善他们在做什么。还有一大堆其他更深层次的洗涤技术,可以使用。”

调查的RTL储蓄可以提供其他可能的力量。“力量的艺术家会建议编辑你的RTL通过观察你如何做事,“说Ansys同化。“可能是你有这样一个函数实现的,但是如果你实现相同的功能不同的方式,你将节省电力,实现相同的功能。库的优化,将自动扫描RTL和识别的每一个地方,可以升级RTL更高效的实现。它会告诉你它将节省多少权力基于估计和会实现那些如果你批准。”

初步估计
很少有人会认为,早期的权衡可以评估,他们可能有越大的影响。“更广泛的范围,你带来的多方,你退后一步,看它之前,你开始看到更大的机会越多,“Knoth说。“这些都是大趋势,超越的一个小部件你生产好。你必须看看小部件适合在小发明,这符合产品在数据中心内,被连接到水电站或太阳能农场。”

问题在于,没有足够估计是准确的,错误的决定也可能的。”作为设计变得更大、更复杂,它变得越来越难以产生准确的估计,“Schirrmeister说。“举个例子,你需要布图规划的信息来估计有多少注册需要在硅的路径,因为传播信号跨大芯片尺寸非常困难,不可能在一个时钟周期内完成。NoC,我们试图优化寄存器的数量,影响功耗和芯片的互连你随身携带。我们注释,从lib,回到NoC,初步估计的路径将会多久。它将必须精炼以后吗?绝对的。问题的多维现实很困难,特别是在垂直的依赖。”

能够执行一个分析热,长时间必须考虑,你必须看看现实的工作负载。最有可能意味着实际运行软件。“大多数的行业使用他们的RTL代码映射到一个模拟器,真正的软件工作负载在该平台上运行,并获得向量从他们做一个估计,“Knoth说。“每天多次迭代,他们可以调整软件,更有效地利用硬件特性。一夜之间,他们能使硬件调整。现在你有这个系统级共同追捕耗散功率,确保你创建最优的系统。”

这个行业总是寻找方法来插入抽象模型,而不是使用RTL,因为它可能会运行得更快,因为分析可以执行RTL之前准备好。“能耗分析软件执行已降级仿真平台直到现在,“Innergy的Huilgol说。“有一种技术可以帮助正在建设力量的硬件模型,可以模拟软件环境。这些模型可以提供准确的反馈关于瞬时和平均功耗各种硬件模块和软件运行。这使硬件和软件共同tape-out之前对权力。”

采取类似的方法进行功能验证的硬件和软件在过去,现在正尝试应用。“我们不是发明黑魔法,我们不能对抗物理,“Huilgol说。“但你不需要详细的权力运行模拟。取一小块级别的抽样,将这些结合在一起并运行它在子系统层面,系统级仿真,软件,等等。有两个方面。一个是数据通路,另一个是控制路径。我们占了主要的控制路径,但是当有数据路径依赖,有一个在我们的模型数据路径意识到。这些操作在事务模型的统计力量模型。如何提高分辨率?您可以使用更小的周期或单周期。但是如果你的决心是15周期,或者更多,相当大的交易,将会有一些统计错误了。”

反思过去的
过去,摩尔定律使得它很容易从一个节点迁移到下一个,利用额外的盖茨,更高的性能和更低的权力。这意味着连续性跨越时间是非常重要的,尤其是以确保现有的软件将继续运行在新的硬件。

随着时间的推移,有烤一些效率低下,很难摆脱。“很多事情不可能在过去,“Knoth说。“也许是因为流程节点不能适合所有的计算半导体将部署在边缘。但现在它可以。也许你没有做正确的分析精度的工具在正确的时间,或者是因为包装技术并不是可用的。但是你必须不时地吸一口气,退后一步,重新审视景观,然后问,“我们是正确的优化方程,或者我们只是做最好的我们可以吗?有时我们需要穿上我们的科学家帽,不害怕问题的一些基本原则,我们编纂。”

重要的是要考虑集成的复杂性。”有两个层次的复杂性——应用程序复杂性上升顶部,然后实现复杂性的半导体技术,“Schirrmeister说。“这是我们正在处理的晶体管数量。因为你有应用程序的复杂性,功能增加的数量一样,继续增加,你必须处理共享内存,一致性,等等。如果你没有缓存,你总是四处移动。缓存是一个解决一个问题,引入了一个新的问题。”

处理器所驱动的性能。“添加一个分支预测或投机执行处理器电路中门的数量将会增加,从而增加动态和静态功耗,”拉塞尔·克莱恩说,程序弹射HLS团队主管西门子EDA。“但这些功能增加的性能计算的处理器上运行。所以权力肯定会上升,但能量,这是执行计算,所需功率乘以时间可能会上升或下降。这取决于性能提升的力量增加的比率。说,如果权力上升20%,但性能提高10%,总能量计算增加。”

电力、能源和热不能总是以简单的方式进行了优化。“这似乎违反直觉,但提高性能可以减少一些工作负载的平均能量消耗,”莫里斯·斯坦曼说,负责工程的副总裁Lightelligence。“这种工作负载可以受益于所谓的“种族闲置,在深可以输入电能节约国家长时间如果可以更快地完成工作。考虑工作负载,维持一个可预测的(但利用率不到100%)计算需求概要,说25%的可用性能。一种方法可以降低工作频率(因此降低工作电压)的25%。设备现在将保持完全活跃,但在减少权力。另一种方法将会迅速努力完成工作从而使激烈的权力储蓄- 25%,75%,可能需要为零或接近于零能耗从而导致较低的平均功率比常数操作时钟率25%。它甚至可能有利于超频/过电压进一步增加超过75%。”

平衡的硬件和软件
最大的平衡技巧相关系统的复杂性和权力是建立硬件/软件的边界。“任何函数中实现软件是数量级低于相当于函数在硬件中实现,“西门子Klein说。“任何软件,根据定义,而不是最优的。高度优化的软件在一个非常有效的处理器不能方法的效率甚至糟糕的硬件实现。”

分区决策变得容易,Klein说“应该留在软件,一个处理器上应该做些什么,和更有意义的事情来创建一个定制的硬件加速器的双轮马车,处理器——这就是你开始看到巨大的100 x 1000 x类型的时间或减少,取决于你的优化您的系统。”

随着性能改进变得更加困难,这些方法成为必要。“底线,更大的处理器更节能,所以得到一个更大的处理器来解决你的表现只需要有意义,如果你不关心权力,”克莱恩说。“正确的答案是把繁重的CPU和定制加速器。”

这种方法已经越来越受欢迎。“专用硬件加速器和协同处理器可以提高系统的性能由于搬到更高级的性能收益减少节点,”安迪Jaros说,负责知识产权销售和营销的副总裁Flex Logix。“专用加速器减轻cpu的处理负担从耗费巨大的计算周期来执行复杂的算法。利用eFPGAs对于那些专用硬加速器提供所需的功率效率,但仍然保持编程工作负载变化时。”

每当你可以专业,有巨大的机会收益。“今天它已成为更容易专门处理器通过添加指令,“Schirrmeister说。“这些指令定制完成低功耗的目的。我所见过的情况下,一个额外的处理器中指令允许你呆在内存的一半。从权力的角度来看,意义非常大。但是当你在做什么,在孤岛上,整体的复杂性增加了你想做什么。”

或者你可以移动这个函数所有的硬件。“另一个解决方案是将计算复杂的操作到定制的加速器,”克莱恩说。”高级合成(HLS)是简单的方法来做到这一点。它仍然是硬件设计,所以你仍然需要聪明的工程师,让它工作。但HLS你从一个软件C或c++算法。没有解释的算法,这是一个手动过程较慢,并且容易出错。和黄金的形式引用现成的原始功能从软件,这使得验证简单多了。”

所有这些选择都变得容易。”过去,大问题做出决定在架构级别,你必须重新评估这个决定后来的项目,但是没有连接,流“Schirrmeister说。“等情况下可配置处理器和NoC,流一直都是相互关联的。如果你回去,需要时间重新运行工具,但它不再是人们不得不手动验证架构决策。自动生成允许你浏览更多的数据点。”

结论
优化电力、能源、单独或热的问题并不容易。但需要解决的三个问题正在增长,虽然他们是相互关联的,它并不总是很容易确定哪些应该优化或怎么做。只有通过观察整个系统,才能做出决策。在过去,建模、分析和设计流程做了这个更加困难,特别是当它穿过硬件/软件障碍,但更多的工具出现。它仍然是不容易,但随着行业的认识和更多的人想要解决这个问题,更好的工具和流动将变得可用。



留下一个回复


(注意:这个名字会显示公开)

Baidu