中文 英语

更认真地对待权力

如果没有扩展的好处来帮助降低功耗,设计团队必须自己承担责任。这一切都始于架构。

受欢迎程度

越来越多的电子系统正受到热问题的限制,解决这些问题的唯一方法是将能源消耗提高到主要设计问题,而不是最后一刻的优化技术。

任何系统的优化都涉及到静态和动态技术的复杂平衡。我们的目标是在尽可能小的区域内实现最大的功能和性能,同时使用最少的能源。但直到最近,功率优化都是最后一个考虑的标准,而且只有在达到性能目标后还有足够的时间时才会进行优化。对于越来越多的设备来说,这不再是一个可行的策略,因为功率是可以实现的主要限制因素。除非将电源和能源视为架构分析的一部分,包括硬件/软件分区,否则后期的电源优化将不足以保持竞争力。

目前使用的大多数优化技术都是在RTL完成之后部署的,有些是在详细实现期间部署的。这在栅极尺寸上表现得很明显,例如,利用时序松弛来降低晶体管的性能,从而降低功耗。在RTL实现过程中还使用了其他技术,例如时钟门控,它利用硬件触发器在显示时钟不必要时关闭时钟。

根据最新的威尔逊研究集团和西门子EDA, 2022年功能验证研究,72%的ASIC设计现在使用某种形式的有源电源管理,如图1所示。

图1:需要验证的ASIC电源管理功能。来源:西门子EDA

图1:需要验证的ASIC电源管理功能。来源:西门子EDA

“如果你回顾10年前,这一比例应该是62%,但实际上,在过去的几项研究中,这一比例已经稳定在72%左右,”该公司首席验证科学家哈里·福斯特(Harry Foster)说西门子EDA以及领导这项研究的人。“然而,如果你再深入一点,看看超过200万个大门的设计,你会发现这一比例为85%。”

开发流程中的权力
功率问题无处不在,因为每个设计决策,从最大到最小,都会影响功率。“要了解有关电力和能源的任何事情,你必须考虑这么多不同的因素,”英国电力公司的产品管理总监罗布•克诺斯(Rob Knoth)表示抑扬顿挫的Digital & Signoff集团。“你需要了解功能活动、系统意图、物理、互连和门——所有的一切。为了做出有意义的决策,你需要非常多学科,对于真正关心这个的客户,那些正在进行令人难以置信的能量密集计算的人来说,这很重要。”

人们的态度正在改变,尽管速度缓慢。西门子EDA的Veloce Power产品经理阿米尔•阿塔哈(Amir Attarha)表示:“我们一直关注的是业绩和取得成果的时间。”“现在是时候在电力预算范围内获得结果了,而电力预算可能会影响到获得结果的时间。它从一个非常高的层次开始,当你在做软件硬件划分,决定哪些部分需要在软件中,哪些部分需要在硬件中,以及微架构决策,如自适应电压缩放,或动态电压频率缩放。这些技术中的每一种都需要权衡。例如,您不能立即从一个频率跳到另一个频率。它能为他们现有的每一种算法提供足够的好处吗?”

日程也会间接影响它。Redwood EDA的创始人兼首席执行官Steve Hoover说:“项目总是把电源目标放在前面,但电源功能放在最后,因为需要交付能够启动验证工作的功能。”“当权力成为焦点时,实施团队已经在布局上取得了进展,项目已经落后于计划。添加时钟门控会产生新的错误,给时间和面积带来压力,并需要实现团队重新工作。当调度是最高优先级时,这些都是不可取的。因此,管理层做出了一个艰难的决定,接受更高的平台成本,并开采温度略高的硅片。”

权力问题向左转移
软件开始发挥更大的作用。公司系统架构副总裁Piyush Sancheti说:“公司认为电源是一个包括软件和硬件的系统级问题Synopsys对此.“这是一个系统如何构建的不断权衡,决定了硬件和软件中构建多少电源管理智能,以及从软件设计和硬件设计的角度来看它有多复杂,最终是对这样一个系统的验证和验证。”

这也对工具提出了新的要求。Cadence的Knoth说:“这通常需要过去没有考虑到的分析水平,只有当技术开始普及时,自动化才成为可能。”“我们已经开始看到更广泛的客户向我们询问这个问题,现在我们必须弄清楚如何使它更可用,如何包装它,如何使它自动化,如何使它更有用。当你沿着食物链向上移动时,首先要考虑的领域之一就是分区。在设计空间探索中我们需要提供什么?我们如何更灵活地模拟划分,并仍然获得足够的估计准确性。”

高级目标有时比局部优化更重要。“对于云工作负载,延迟和响应时间是至关重要的,”Ampere Computing的产品副总裁Madhu Rangarajan说。“任何电源管理技术都必须避免延迟惩罚,这可能会优化一台服务器的本地电源最小值,但会损害整个系统。这可能会导致整体消耗更高的功率。它还将降低数据中心的总吞吐量,从而减少云服务产生的收入。所有电源管理技术都必须在不增加延迟的基本原则下工作。”

这就是为什么它的功率需要在尽可能高的级别上处理,使用定义良好的方法,在设计流程中推进功率目标。“权力在你的整体重要性中处于什么位置?”Knoth问道。“这将指导你将使用何种设计技术。至关重要的是,人们不会自动地跳到,‘我要立即努力挤出每一盎司低效的电力。“这可能会增加额外的延迟和过于复杂的电网,因为所有这些小域分散在各个地方。所有这些都是有成本的,即使只是设计和验证的计划。如果回报不能证明你投入的成本是合理的,那么你很可能做出了一个错误的决定。”

权力的复杂性
虽然增加另一个权力领域似乎相当简单,但可能会有许多隐藏的成本和潜在的问题。“你必须考虑整个电网,以及任何变化对电网的影响,”特朗普的产品营销总监马克•斯温宁(Marc Swinnen)表示有限元分析软件.“你需要做一个完整的暂态分析,而电源开关最困难的事情之一是管理电源浪涌。当你打开某个设备时,就会出现峰值功率。它不仅仅是块被打开,而且所有周围的逻辑都感觉到了电流的下降并经历了电压下降。它不是免费的。打开一个区块需要消耗一定的电力,你必须考虑到这一点。如果我因为没有短暂地使用它而关闭它,那么是否值得关闭它,因为重新打开它将花费我的电力和时间。”

这也会影响功能验证。西门子的福斯特说:“当你关闭某个设备,然后再打开时,你必须验证它是否正常工作。”“块应该保留状态吗?这是否正确?”你必须验证权力的转移,因为基本上你有一个概念性的状态机,你必须验证这些权力状态的转移。”

由于时间常数,对热的考虑增加了另一个层次的复杂性。克诺斯说:“电力的时间常数很短,而热能的时间常数却很长。”“在热管理方面,硬件和软件控制都有一席之地。有些事情最好是用硬件即时控制,这可以帮助防止热问题的发生。热效应不是瞬时的,它们随着时间的推移而增强,随着时间的推移而消散。软件控制在确保整个系统不违反热预算方面起着非常重要的作用。这不是一个只能由其中一个解决的问题。这需要双方握手。”

时间常数可以被利用。“从长期来看,大多数系统的峰值功率需求大于它们作为热量消耗的功率,尽管当使用模式包括系统可以冷却的恢复期时,可以利用短峰值来提供更高的性能,”内部电源软件技术主管克里斯·雷德帕斯(Chris Redpath)说手臂的中央工程。“这需要一个复杂的动态功率控制系统,在硬件和软件上运行。”

这是推动左移概念的问题之一。西门子Attarha表示:“我们被要求整合解决方案,将放置和路由的最早维度转移到后面。”“你需要它来开始进行热分析。切换数据可以发现工作负载中的高活动区域,但你需要能够将其映射到早期的物理位置,然后使用物理计算出可能的温度。”

准确性和抽象性
过去使用的假设不够准确。“你需要知道流过所有电线的电流,这样你就可以计算电压降,”Ansys的Swinnen说。“但这是依赖于温度的,所以你需要知道全球温度,这取决于散热器和环境,但整个芯片的温度是不同的。在过去,整个芯片上的单个温度就足够准确了。但是现在我们需要做热模型,包括焦耳自热。当电流流过导线时,导线会被加热。”

这方面的问题会随着小字而爆发。Synopsys高级营销总监谢卡尔•卡普尔(Shekhar Kapoor)表示:“在异构集成环境中,你要处理不同的材料和不同的节点。“你有不同的基质,它们可能也各不相同。所有这些不同的热膨胀,你会看到不同数量的翘曲和机械应力进入画面。首先是功率密度的问题,由于晶体管密度的原因,功率密度可能很高,现在又有额外的热问题。这些问题不能被忽视,它们必须是系统规划的一部分,如果您预先适当地划分您的设计,它们可以得到更好的管理。然后,您创建必要的模型并进行层次分析,同时进行架构规划以管理和解决该问题。所以当你研究多芯片系统时,分区、电源和热都是密切相关的。”

得到正确的模型是很棘手的。Knoth说道:“任何时候你在处理IP整合问题时,都会自然而然地出现一些抽象内容。“你要处理的大量数据和信息让它变得更加困难。此外,如果你不能改变盒子里的任何东西,了解盒子的内部结构可能会带来额外的成本,在计算能力、时间、周转时间等方面,这是你无法承受的。随着高阶模型越来越多,您将开始看到越来越多的高阶模型的相关性。但是你越抽象,你就越失去一些精细的保真度。根据芯片的架构,您可能不想要模型。你实际上希望能够细粒度的权力门控,这样你就可以准确地让它按照预期的方式跳舞。”

需要更多的模型
当你在设计所有的芯片时,处理这些问题是一回事,但如果第三方芯片市场成为现实,那就完全不同了。Synopsys的Kapoor说:“在芯片层面,当所有这些芯片或芯片来自不同的来源时,一个巨大的新兴需求是必须与之配套的电、热和机械(ETM)模型。”“你会有一个封闭的系统,堆叠系统,还是你会有一个2.5D封装?所有这些类型的建模需求正在出现。气流是另一回事。你能期待什么样的气流?这将会进入我们的视野。今天,使用的是手动创建的模型,但是否存在标准化?现在还没有,但随着小芯片越来越流行,这些模式将会出现。”

在抽象的最高层次上,对这些模型的需求是显而易见的。安培公司的Rangarajan说:“标准和开放接口有很大的发展空间,可以实现无缝应用的细粒度电源管理,即使是在异构系统中。”“例如,如果主机cpu中有一半的线程是空闲的,是否有可能关闭DPU的部分以节省平台级别的额外功耗?当主机- cpu需要时,这些部分能否以可接受的延迟被唤醒?在ACPI电源管理机制中,您已经看到了许多联合硬件和软件电源管理的示例,但是这些示例是以客户端和遗留服务器为重点编写的。它们需要显著进化,才能在云原生世界中发挥作用。这将涉及新的硬件设计和新的软件/硬件接口。”

但同样,这些模型必须在最详细的级别上工作。“在单个模具上,电感不是问题,因为距离和长度足够小,”Swinnen说。“但是当你使用插入器时,它有电源互连和数千个长距离的细尺寸信号,电源纹波或噪声可以通过电磁传播到耦合线路上。如果在电源线旁边的中间线上有一根3或4厘米长的母线,而电源有波纹,信号就会感觉到。”

结论
在许多情况下,电力和热力问题正成为一个普遍存在的问题,将成功的产品与其他产品区分开来。它将影响整个开发流程,从概念创建到架构分析和硬件软件分区,再到块、模和包的设计、实现和集成。

目前,许多方面的模型都是手工拼凑起来的。但是它将需要广泛的模型,具有正确的抽象和性能,来执行无数必要的任务。



留下回复


(注:此名称将公开显示)

Baidu