中文 英语

提升权力的抽象层次

为功率分析和优化找到正确的抽象来自于工具集成。

受欢迎程度

节能设计仍然是一个相对的问题新的担忧对于许多半导体产品来说,自成立以来,它已经以不同的方式发生了几次变化。

最初人们关心的是峰值功率.今天,他们关心的是峰值、总能量、热和其他影响。业界已经尝试了几种抽象方法,从系统级分析(承诺淹没实现级优化)到深入到门级(提供准确性的物理细节)。今天,这个行业围绕着RTL功率模型和工具。

“这些年来,权力对不同的人有着不同的含义,”该公司产品管理总监罗布•克诺斯(Rob Knoth)表示Cadence设计系统.“这部分反映了EDA工具的位置以及这些工具实际上可以提供什么。另一个组成部分是人们被迫设计的东西。这已经从频率之争转向了功率的讨论,现在人们关注的是能源而不是功率。”

新的实施技术增加了为什么必须比过去更多地管理电力的原因。RTL产品管理总监Preeti Gupta表示:“管理功耗和电源噪声对于较小节点的设计来说是一个巨大的问题,因为它们可能直接导致设计失败有限元分析软件.更高的器件电容、互连电阻和7nm/5nm的电流密度强调了动态功率和热管理的重要性。较低几何节点的设计和制造成本正在上升,为了管理成本和资源,设计团队需要确保第一硅的成功。这些考虑要求设计方法向早期分析转变,这可以更好地影响下游决策,并及时发现设计问题。”

建筑电力
早期的分析可以带来最大的收益。“当然,高抽象提供了更多的分析能力,速度也快得多。Mentor是西门子旗下的企业.“从数据准备的角度来看,在更高的抽象级别上评估功能对用户来说更有吸引力,因为它需要更少的准备。”

早期决策决定了产品的功率和能量配置。Gupta说:“诸如如何将设计划分为硬件和软件、设计架构以及软件如何控制硬件等关键选择都有很大的影响。”“一旦设计架构确定下来,逻辑合成地点和路线可以最大限度地减少该架构所需的电力。”

克诺斯对此表示同意,但有一个警告。“在大架构层面,诸如芯片上的核心数量,或者如何管理分布式处理等决策可能会导致相当大的准确性损失。某些体系结构决策可以承受严重的不准确性,但是最高效的体系结构决策仍然需要尽可能早地提供最佳的准确性。但有了力量,甚至比表现更重要的是,你会被千刀万剐,真正改变你认为合理的假设,与现实相比。”

要理解这意味着什么,请考虑一个人工智能(AI)应用,包含大量MAC功能,占总功率的相当大一部分。Cadence公司产品管理部门主管卡姆•基特雷尔(Kam Kittrell)表示:“很大一部分动力实际上是故障动力。”“这是指电路在一个时钟内多次切换,因为不同数据路径之间或单个数据路径内的竞争条件。这需要知道准确的时间,你需要布局来获得这种准确性。您可以根据来自静态时间分析条件的逻辑和到达时间级别进行估计。因此,您可以在RT级别上得到相当好的估计。我还能看到SystemC该模型带有一个附加的功率模型,该模型在运行时反馈其消耗情况。”

然而,这还远远没有解决。“虽然早期的事务级功耗分析可以带来显著的架构功耗探索优势,但该方法仍在为主流使用而发展,准确性是一个挑战。”

考虑到刺激
早期的功率分析工具使用统计方法,但事实证明这太不准确了。现实的刺激是必需的,但获得正确的刺激同样具有挑战性。

克诺斯说:“你可以选择任何电路,根据刺激的不同,你可以让它看起来像冰块或煎锅。”“获得正确的刺激,正确的活动信息,然后能够把它卷起来,这是有关系的建筑水平确保重大决策是正确的。这是一种与绩效无关的功能性关系。”


图1所示。半导体设计中考虑的功率问题。来源:节奏

你如何想出一个会产生最坏电力条件的场景?“首先,你必须定义最糟糕的权力类型是什么,”Kittrell说。“它是最大功率还是Di/Dt?它是最大平均功率,还是只是平均功率?为了优化,他们经常考虑最大平均功率,而为了杀死芯片,可能是功率增长太快,所以他们正在寻找di/dt情况。但问题是你在哪里找到这些。关键的标准是为设计获得正确的刺激,以便进行优化。当我运行一个应用程序时,我如何提出可能发生在电路上的现实和概率场景?”

找到最坏的情况可能很困难。Knoth说:“为了达到最坏的情况,你必须使用高容量模拟、精确的功率分析和基于框架的架构来检查刺激,使你能够快速搜索和找到峰值切片。”“一旦你有了病理载体,我们就会用智能分析来告诉你应该把时间集中在哪里,以最有效地提高功率。”

Kittrell补充了一个警告。“你怎么知道你有最好的电力方案?你真的从来没有。便携式刺激(PSS)非常适合soc类型的设备,特别是缓存的多核设备,因为有很多潜在的场景。同时有多少核在工作?使用PSS可以进行扫描——打开电源,然后关闭,当我进行缓存访问时,有八个内核运行,等等。权力和功能之间有很多相互作用,其中一些是意想不到的。”

当考虑热时,可能需要更长时间的模拟。“传统方法识别适当的活动模式的方法主要集中在功率分析的短时间窗口上,并且当芯片暴露在实际活动中时,它们会有错过功率关键事件的风险,”Gupta说。“尽早了解实际应用程序的电源和热配置文件,例如操作系统启动或高清视频帧,可以避免在设计过程后期出现与电源相关的昂贵意外,但它们可能需要数周时间才能运行。高性能RTL功率引擎和模拟器功率流现在已经发展到可以为非常长的矢量生成精确的每周期功率分布,比传统方法快几个数量级。这使得在数小时内计算包含数十毫秒活动的高清视频帧的功率成为可能,以及在一天内分析包含数百毫秒数据的操作系统启动的功率配置。”

包装技术的发展加剧了这些挑战。“权力方面2.5 d而且3 d设计是巨大的,”Knoth说。“你将这些电路置于它们不习惯的热环境中。有新的侵略者,从一个热容量,可能没有建模在过去。能够有效地从系统的角度看待这一点,一直到导致或受到热状况损害的底层硅组件,这是至关重要的。这是权力的前线。”

但是其中一些问题实际上可能不需要详细的分析工具。Mentor公司Calibre DRC市场总监约翰•弗格森表示:“我们开发了一种围绕3D堆叠进行热分析的技术。“我们吸引了很多人的兴趣,但后来什么都没发生。原因是他们使用它,从中学习,并为什么样的配置会导致问题开发最佳实践,然后他们开发设计方法来避免这些问题,他们不再需要运行分析。设计规则会有特定的设置或要求,会开始告诉你不能让这些芯片靠得太近,或者你不想将CPU堆叠在GPU之上。你需要的是相互之间切换速度不那么快的东西。这些都是设计规则手册的一部分。”

然而,仍然有理由进行这种分析。Gupta说:“专注于电力关键活动区域可以提高生产力和瞬态电力输送网络分析的覆盖率,并降低设计失败的风险。”“基于实际应用活动的RTL芯片当前配置文件是芯片、封装和电路板早期协同设计的推动者。在系统层面,功耗对热性能有直接影响。了解整个实际应用场景的功率分布,可以确定设计中消耗功率最大的区域,从而导致热问题。”

RTL提供了坚实的基础
RTL功率分析提供了准确性和性能之间的平衡。在设计流程的早期,可以发现并纠正严重的体系结构问题。“相比之下,RT水平的容忍限制更宽松门级法哈德说。“这是准确性和时间之间的权衡。与门相比,“估计”RTL功率要快得多,而且它发生在设计的早期阶段,那里几乎没有可用的物理信息。设计师并不是真的在寻找功耗的精确测量,而是只关心整个设计中功耗的大致分布。换句话说,试着看到电源的趋势,并在设计中定位电源热点,这样设计中耗电的部分就可以考虑降低功耗。”

不过,准确性已经有所提高。Knoth说:“传统上,RTL功率分析的概念听起来很好,但精度并不高。”“现在,我们看到,通过RTL功率分析工具与实现和注销技术之间的更紧密集成,我们能够在RT级别提供非常好的准确性。”

节省的时间是相当可观的。“与综合设计和计算门级功率所需的几个小时相比,RTL功率分析可以在几分钟内完成,”Gupta说。“在RTL中模拟设计活动以获得高覆盖率也容易得多。”

模拟也可以扩大覆盖面。Kittrell解释道:“当你运行软件时,仿真基本上会计算在设计中发生的切换次数。“如果你想要峰值功率或最大平均功率,那么你可以运行很多软件场景,寻找有很多活动的帧。然后,一旦你有了这个场景,你就可以把它剪掉,看看它在门级别上是什么样子的。这意味着你做一个快速的综合,我们可以得到。lib功率信息,已知的寄生,我们可以加载寄存器中的内容,并进行快速的基于周期的模拟,以获得最准确的切换,不仅是概率数字,而且是通过数据路径的准确切换计数。如果您只是使用概率切换的估计,则可能会有10%或15%的误差。关键在于捕捉有趣的场景,然后集中注意力,而不是试图在门级别上对整个软件运行时进行功率分析。”

可以执行与节能直接相关的有意义的分析。“消除冗余开关是管理动态电源的一个关键组成部分,”Gupta说。“RTL电源效率指标可以识别设计中浪费的开关。基于rtl的功耗降低技术还支持活动感知的复杂分析,以自动识别时钟、顺序逻辑和容易出现故障的数据路径逻辑的更改,以解决浪费的活动。在更高的设计抽象级别上工作,RTL提供了分析大型设计的能力,因此可以隔离块之间交互所浪费的能量。这是实现工具无法实现的。”

Knoth表示同意。“我们在电路中做了一些深入的分析,并观察功能活动,以了解哪里有浪费的电力。我们将其定义为不会产生有用结果的权力。也许重置已经启用,但时钟正在运行。在分析时,我们可以从实际功率中减去该功率,以提供理论上的理想功率。这种分析有助于设计师集中精力获得最大的投资回报率。”

工具集成
功率分析的许多改进都是通过不同工具的集成实现的。Knoth说:“在过去,功率分析更加分裂,因为每个团队使用不同的功率工具。块实现团队可能一直在运行门级工具。电源架构师正在运行一些更高级别的分析。今天,他们都在使用一种工具,可以说同一种语言,可以吸收所有正确的输入,并对刺激进行正确的分析。这使得团队能够改变他们的方法,并更早地为他们的流程注入力量。”

这种连续性也可以带来其他工具的可能性。古普塔说:“在整个设计过程中监测功率数据,确保下游设计更改不会无意中影响其功率性能。”“功率回归提供了各种功耗降低工作有效性的反馈,并跟踪多种运行模式下的功率效率。能够在RTL更改时查询数据库并比较结果,从而避免了后续设计更改引起的不幸意外。RTL功率回归为设计师提供及时的反馈,以修复功率错误,而不是在设计流程的后期将功率错误与功能联系起来。”



图2所示。跨不同带宽场景的RTL功率探索。来源:有限元分析软件

这是一个重大的进步。克诺斯说:“现在,凳子的三条腿都可以从权力中受益。”“强大架构师、RTL设计人员和块实现团队都在一起工作。这就是我们今天的处境。RTL功能非常有用,而且工具也在那里。人们实际上在利用它,使他们的设计更好。



留下回复


(注:此名称将公开显示)

Baidu