中文 英语

与高级节点设计中的变化作斗争

利润不再有效,所以现在必须在设计方面解决这个问题。

受欢迎程度

变化正在成为高级节点的一个主要头痛问题,以前在晶圆厂处理的问题现在也必须在设计方面处理。

从根本上改变的是,长期以来一直被用作变化和其他制造工艺相关问题缓冲的余量,在这些前沿设计中不再适用,原因有二。首先,利润率会影响性能和功率,这是迁移到这些高级节点的全部原因。其次,在这些芯片中,保证金并不总是能控制与变化相关的问题。电介质更薄,在更细的导线中电阻和电容更高,动态功率更密集,晶体管之间的距离更小。因此,虽然变化可能不会在28nm工艺上造成问题,但在衍生设计中缩小特征会在一两个节点后将二阶效应转变为一阶问题。此外,随着机器学习引入这些设计,这些问题会随着时间的推移而改变。

“传统上,工程技术的发展总是非常简单,”João Geada说有限元分析软件.“首先,我们忽视它,直到我们不能再忽视它。当你不能忽略它时,你就把它放在边上。当边际利润变得太痛苦、太昂贵时,你就会衡量它。这就是万物进化的过程。我们在硅制造中使用的任何技术都遵循这一轨迹。因此,在90nm时,变化变得明显,但这是微不足道的。它变成了在16nm时不容易被边缘化的东西,所以它必须开始被测量。从16nm开始,理解和处理它,并在系统和设计层面考虑它变得越来越重要。”

通常情况下,这是根据屈服时间来衡量的,但随着更先进的节点芯片进入功能安全和关键任务设计,屈服就有了另一个维度。这不仅仅是一个芯片在制造后是否工作。它还涉及芯片在预期寿命内的工作方式,这进一步增加了模拟、测试、检查和制造后分析所花费的时间。对于任何在最先进节点上竞争的人来说,这都增加了风险,因为这些节点的成本已经是天文数字。

Geada说:“考虑到生产7nm、5nm或更低工艺的成本,没有人愿意投入1亿美元成为第二名。”“忽略工程,只看模具和打印成本。如果加上工程验证,那就太荒谬了。你不想这样做而成为第二名,所以你要尽可能地把它推到边缘而不交叉。保证金不是这么做的。边际是一种工程上的故障保险,可以让你快速到达那里,但它们不能让你那么接近边缘,因为边缘很粗糙。”

变异在过去被认为是纯粹的制造问题。然而,它越来越多地包含了硬件-软件协同设计的元素,其中算法需要与硬件一起在可接受的分布范围内运行。

Geada说:“这引发了关于批量分析的讨论,因为系统在任何一个时间单位内所做的事情与硬件物理实际能够跟上的事情相互作用。”“它与制造实际能够实现的东西相互作用,它与该芯片的特定副本如何装入封装相互作用。所有这些都有可变成分。工程学并不精确。而且,昨天的系统和今天的系统也不一样。从许多方面来看,我们正处于这个世界变化的开端。作为一个行业,我们有故事的开端。我不知道我们是否有完整的故事。我们仍在建设中。”

建模的变化
至少从设计的角度来看,这幅图中缺少的是对复杂系统中所有不同部分如何交互的理解——特别是在各种使用场景下——以及变化如何影响整个系统运行。这包括多个过程、电压和温度角的多个约束、依赖关系和变化。

该公司高级首席产品经理Seena Shankar表示:“接近阈值的电路行为一直非常容易受到工艺变化的影响节奏.“非高斯分布已经成为许多常规电源设计的常态,但在接近阈值时,这些分布的偏度非常高。”

几年前,引入了先进的芯片变异(AOCV)和自由变异格式(LVF)等方法,以实现更准确的变异感知时序签到。然而,这些模型无法捕捉非高斯行为。

Shankar说:“OCV是所有实例的单一降级因素,它最终是非常乐观或悲观的,因此不足以模拟高级节点的变化。”因此,LVF是行业标准finFETs和下面。它捕获每个定时弧的回转和负载依赖的西格玛,包括延迟、过渡和约束。Cadence建议引入额外的Liberty结构,如均值偏移、标准差和偏度,这些已经得到了LTAB (Liberty技术咨询委员会)的批准。这些构造描述了分布的前三个矩,更精确地模拟了非高斯行为。为了模拟高度非高斯行为,带矩的LVF是高度准确的,并且与蒙特卡罗结果精确相关,无论是对于高级节点还是支持针对物联网应用的近阈值电压域的成熟节点。”

对此有不同的观点。“虽然改进了,但越来越复杂的变化建模是可用的,并正在进一步开发,但这仍然是一个困难的领域,特别是对于先进的finFET节点,在大尺寸的芯片上增加工艺变化,在更低的核心VDD电压下增加单位硅面积的功率,”Richard McPartland说Moortec.“一个挑战是大型多核处理器芯片具有软件驱动的工作负载。但最坏的工作量很难预测,特别是如果软件是后来由另一个团队编写的。”

Moortec提倡在芯片内嵌入传感器结构,从而在通常非常大的芯片上提供关键电路的状况的可见性。这些传感器跟踪热点、电压下降和工艺变化。McPartland表示:“这将使SoC团队能够验证他们的设计,特别是在新硅的培育阶段。”“例如,在我的大型高级节点finFET芯片上,我实际上看到了多少工艺变化?关键电路的电压下降有多大?热点在哪里,它们在负载下的表现如何?改进的变化模型对于跟上高级节点中不断增加的过程变化和其他挑战是必不可少的,但芯片内监控将让您了解其实际效果如何。此外,它还可以优化性能和/或功率。”

然而,对于22nm和更小的工艺节点,Liberty变体格式(LVF)是当今领先的标准格式,用于封装标准单元和自定义宏的变体信息。

“如果你有一个高级的过程节点库,你的延迟和约束的变化建模很可能在LVF .lib中描述,”在美国的AMS验证产品经理Wei-Lii Tan说Mentor是西门子旗下的企业

但是创建LVF .libs比创建名义的.libs更具挑战性,Tan解释道。LVF表存储的不是每个表项的单一标称值,而是每个测量的早期和晚期统计变化(sigma)值,这需要蒙特卡罗等效模拟来生成。这将导致在描述过程中对运行时产生重大影响。随着Moments的引入,LVF现在包含了额外的属性,如标准差,以及非高斯属性,如偏度和均值漂移。这使得能够以额外的运行时成本对每个测量值的统计分布进行精确建模。


图1:带矩的LVF .libs包含每个测量条目的标准偏差值。资料来源:西门子旗下的Mentor公司


图2:带矩的LVF .libs还描述了每个测量条目的非高斯统计值(例如偏度)。资料来源:西门子旗下的Mentor公司

如上图所示,LVF变化模型包含的信息明显多于名义值时序模型。LVF模型需要蒙特卡罗分析才能产生,导致表征过程较长。

“为了使LVF表征可行,表征工具使用了各种技术,如网表约简和基于灵敏度的近似。然而,这些近似可能会导致结果的.lib不准确。这些不准确性会导致不正确的静态时序分析(STA)结果,可能会导致硅失效。”


图3:在表征结果中发现的LVF问题的一个常见示例-长尾值的不准确性。这导致了时间差异和潜在的硅故障。资料来源:西门子旗下的Mentor公司

当今的许多变化建模流程缺乏一种可靠的方法来验证.libs中的变化数据,导致有错误或有噪声的LVF值,这可能会使计时结果在生产精确范围之外摇摆50%到100%。

“对标准单元和高级工艺节点的自定义宏进行有效变异建模的关键步骤是对变异模型进行高度可靠的验证方法,”Tan说。“验证方法应该有广泛的覆盖范围,以考虑所有过程、电压和温度(PVT)角落的变化效应贡献者,并且还能够为任何问题领域提供完整的蒙特卡罗等效验证。”

反过来,这为机器学习打开了一扇门,可以分析一个图书馆中所有pvet的完整变化模型数据集,以识别异常值和潜在问题,然后可以深入到潜在的问题区域,并在这些数据点上运行完整的蒙特卡罗等效验证。这里的目标是精度相当于运行蛮力蒙特卡洛,但模拟次数要少得多。

虽然我们很高兴地认为,流程节点内的制造变化正在稳定下来,但事实并非如此。

“它不能安定下来,”吉达说。“我们正在处理原子公差和量子系统。它在某些方面已经变得更好,特别是电子束技术,有一些东西可以更可靠地制造。但我们在很久以前就达到了物理学的极限。”

结论
随着技术的不断进步,需要新的解决方案来支持这种进步。

Geada说:“除了制造方面,我们学到的是如何设计这个和那个。”“我们采用了标准LVF,因此计时可以理解单个晶体管对变异性的影响。但是,目前还没有发生的,已经开始成为热门话题的,是金属变异的处理。金属化本身有变量。它与单个晶体管的性质非常不同。我们看到的电压是可变的。电源不干净,温度不干净。特别是当你开始谈论全3D的时候chiplet域,突然之间,一些现有工具一直存在的假设,比如温度是均匀的,不再成立了。你将在整个芯片上拥有持久且可移动的显式热梯度。”

这些问题对于垂直集成的制造商来说非常具有挑战性,因为它改变了对系统的看法。“但这是可以理解的。但是如果我把这些被分离出来的小芯片,然后我把它们放在这个系统里有人把一些热的东西放在上面,但只有一半是热的?均匀的温度很容易处理。温度梯度则不然,”他说。

这也是算法开始变得很奇怪的地方,因为随着算法开始适应和优化,梯度也会改变。Geada回忆说,这可以追溯到第一台英特尔安腾处理器,它不可能保持所有核心都处于活动状态。“它实际上必须有一个旋转的冷核心,因为任何一个活跃的核心都会产生太多的热量,而你不能有太多的热梯度,因为这会导致封装破裂,所以它必须旋转以保持芯片均匀加热。”

他说,这同时限制了性能,因为总有一个性能权衡。“现在,在这些不同的环境中,你肯定会遇到这个问题。Itanium是一个2D问题。只有边缘才可能有梯度。当你进入一个全3D环境,使用HBM堆栈和SerDes时,这是一个挑战,这是你不能再安全边际的东西。”



5个评论

凯文·卡梅隆 说:

建模变化是一个老问题。它使用Verilog-AMS等标准语言。
在高可变性的硅中工作时,还需要转向异步逻辑。没有太多的工具可以做到这一点。

安Mutschler 说:

说得好,卡梅隆。那么现在有什么选择呢?都是定制的还是手写的?

凯文·卡梅隆 说:

如果没有链接,这就没有意义了

patents.google.com/patent/US8478576B1

http://www.linkedin.com/company/29351052

凯文·卡梅隆 说:

高可变性硅需要异步逻辑方法,只有一家公司成功地做到了:ETA Compute。

亚历克斯V苏尔科夫 说:

异步逻辑有很多缺点。其中最多的:1。异步方法几乎与基于sta(99.9%)的工具不兼容。Async非常容易受到串扰和噪声的影响。在某些情况下(所谓的双轨道异步逻辑),与传统的同步设计相比,它可能有非常高的功耗。
在过去的20年里,有几家公司最初宣称他们提供了异步解决方案,但后来却在没有任何显著成就的情况下消失了。世界上有一些学术机构在研究异步设计方法。他们的工作最重要的成就是A4A(异步模拟)应用,一些安全芯片,以及恶劣环境和能量收集应用。但没有人谈论针对消费者市场的异步开发。
另一方面,过去的几年揭示了NTV设计的新需求:神经网络和低速noc。这些应用程序已经显示了对异步设计的新兴趣。但除了这个应用之外,恐怕在商业电子产品中没有其他异步设计的空间了。只是一厢情愿的想法。

关于这个主题:情况确实像描述的那样严重:非高斯分布经常导致SSTA结果和香料级模拟(使用MC)之间的很大差异。尤其是在门槛附近。这就是为什么Synopsys甚至使用机器学习方法来实现与香料级MC模拟更好的相关性。
谢谢你的文章!

留下回复


(注:此名称将公开显示)

Baidu