袋子里的另一个工具

多比特寄存器允许工程团队在广泛使用的时钟门控之上实现额外的功耗降低。它们在高级节点中的应用正在加速。

受欢迎程度

在一个复杂的芯片中,时钟可以占到总动态功耗的25%到40%,所以当寻找降低功耗的领域时,时钟树网络是一个很好的起点。

从结构上讲,单比特触发器当然可以有一个时钟连接到每个触发器,并且功率通常与时钟树中缓冲区的数量成正比,约为7X,不包括寄存器功率。

“与其让每个单独的触发器连接到一个时钟(因为在同步设计中,时钟驱动每一个触发器),为什么不让同一个时钟的缓冲区连接到多个触发器呢?”该公司低功耗产品营销总监克里希纳•巴拉钱德兰(Krishna Balachandran)问道节奏.“如果你能做到这一点,然后如果合成引擎可以智能地交换单触发器,而不是使用多比特触发器(也称为多比特寄存器,是触发器的组合),那么你本质上所做的就是在一个缓冲区中共享相同的时钟启用,并减少时钟树上的负载。通过这样做,你可以减少时钟功率,从而节省很多时钟功率。我们已经看到,仅仅通过智能交换合成,就可以节省5%到10%的芯片总功耗,然后是这些触发器的位置感知合成——交换掉单比特触发器,代之以多比特触发器/多比特寄存器。仅此而已。”

从技术上讲,多位寄存器是使用共享同一时钟的多个触发器构建的顺序元件,该公司的位置和路由集团营销总监Sudhakar Jilla解释说导师图形.多比特寄存器的单个实例可以表示具有相同时钟条件的多个比特。多比特寄存器通常在RTL期间合成,并在地板规划/物理设计期间作为存储寄存器处理。

此外,由于多比特寄存器共享相同的时钟,与单比特寄存器相比,它们有助于减少缓冲区/逆变器的数量。这直接转化为时钟树中较低的动态功率。由于动态功率在16nm及以下的finfet中变得越来越成问题,因此该技术对于有效控制动态功率至关重要。他说,多比特寄存器还可以实现更小的面积和更低的泄漏功率。

密度的增加是动态功率在16/14nm及以下成为严重问题的主要原因。虽然finfet大幅降低了漏电流,但仍然有更多的晶体管被塞进一个狭小的空间。高性能内核(hpc)的特点是对功率、性能和面积的要求非常高,因此控制时钟功率对于实现这些目标至关重要。“多位寄存器是一种降低功耗的技术,它需要在多模式、多角、多电压环境下从RTL合成、布局规划、放置、时钟树合成、路由和优化开始的整个流程中得到解决。”

Ashwini Mulgaonkar,物理实施产品营销总监Synopsys对此他说,多比特寄存器的概念并不新鲜,但它们在20nm和16nm的应用比在28nm和40nm的应用要多。她指出,即使在130纳米的工艺下,也有一些领先的客户在使用它,但这些客户都是非常非常关注功率的用户。“通常情况下,如果你同时考虑泄漏功率和动态功率,直到16nm和finFET,大多数关注的是泄漏功率,而不是动态功率。但随着finFET技术的出现,泄漏问题有所缓解,动态功率再次上升到顶峰。随着时钟网络变得越来越大,它在芯片上消耗的总功率份额越来越大,在芯片上占的总面积份额也越来越大。”

设计团队从动态功耗甚至整体功耗的角度考虑,时钟树功耗必须降低。降低时钟树功耗的一种非常简单的方法是采用多比特触发器,因为这不仅有助于多比特触发器——例如,8位触发器与8位1位触发器。她指出,触发器本身的面积将更小,因为它本质上是一堆这些单比特单元共享这些单比特单元之间的时钟线。“所以,你节省了面积,你节省了引脚帽,而且,现在你有了多比特的触发器,你的叶级触发器的数量减少了,净电容也下降了。回到工程学院的功率方程,任何电容的减少都将有助于降低动态功率。”

在访问单元库时,可以选择是单比特还是多比特。Mulgaonkar强调说:“在这里,你真的需要有一个适当的特征库,其中包含多位触发器——无论是从时序角度,还是从扫描角度或DFT角度。”“你需要在库中有一组很好的多比特触发器。从RTL与网表的角度来看,你可以推断寄存器,你可以推断出那些在你经历合成流时的多比特的错误,Design Compiler会这样做。在网表级别,我们所做的是,如果客户想要使用多比特浮点数,那么他们可以让我们知道他们在库中有多比特浮点数,这是他们想要看到的映射。客户可以提供一个映射来声明他们的意图,然后在合成和放置和路径中,我们可以进入并将这些单比特触发器物理地合并为适当的多比特触发器。”

三星和联发科最近公开讨论了他们在这方面的经验。

Balachandran同意了。“关于物理感知,你可以在合成中交换这些东西,但如果你的位置和路径不够智能,无法识别这些多比特触发器,那么你就会有一个时钟树,其中一些东西会被放置在物理布局的不同部分,然后你会再次得到长电线,并遇到同样的问题。因此,下游技术——地板规划、地点和路线——必须理解这一点,这样才不会造成路由拥塞,也不会导致以后出现长电线。整个事情必须作为一个整体的解决方案来考虑,从综合开始,一直走下去,并确保地点和路线系统也能处理它。然后你得到了一个多比特寄存器的效果,它的面积比单个触发器小,因为你把它们组合在一起,在库单元级别有一些优化,然后你有更少的导线和更短的导线长度,这也有助于更好的功率。除了节省电力外,还可以最大限度地减少拥堵,甚至可以改善整体设计的时间。”

权衡
Anand Iyer,产品营销总监Calypto他承认,使用多比特寄存器可能会使时钟门控更加复杂,但将多比特寄存器与时钟门控结合起来的好处是允许设计团队实现更大的节能。

“真正的惩罚是,现在你一次只能描述两个比特,而且你正在制造一个新的细胞,所以细胞库将会增加。我们已经看到了细胞库从2000个细胞增加到5000个细胞的情况,因为您需要提供所有类型的多比特。因此,这些工具有时会变慢,因为它们需要读取这个庞大的库,而且所有的算法都需要理解单比特和多比特。因此,流程更具挑战性,但这是人们通常在28nm及以下使用的方法,”Iyer指出。

在一天结束的时候,随着功率成为越来越大的挑战,很难满足特定设计的功率数字。因此,“为了实现这些目标,设计师们在他们的能量设计中添加了越来越多的技术和复杂性。他们正在考虑从哪里削减额外的5%或10%,以达到他们的功率数字。使用多比特寄存器成为他们用来降低功耗的又一个技巧,”Balachandran总结道。



留言回复


(注:此名称将公开显示)

Baidu