中文 英语

不均匀电路老化问题日益突出

在了解老化如何影响可靠性方面,汽车行业正在取得进展,但更多的变量使问题更难解决。

受欢迎程度

电路老化正在成为一项一级设计挑战,因为工程团队正在寻找新的方法来提高可靠性,并确保芯片在预期寿命内的功能。

在数据中心和汽车领域,对可靠性的需求是显而易见的,因为芯片故障可能导致停机或受伤。它在移动和消费电子产品中也越来越重要,这些产品正被用于家庭健康监测或导航等应用,而且这些设备的成本一直在稳步上升。但是,老化也需要在来自铸造厂的变化模型的背景下进行评估,不同的用例可能以不同的方式对不同的组件施加压力,以及不同的功率和热分布,所有这些都使准确预测芯片随着时间的推移将如何表现变得更加困难。

“晶圆代工厂首先提供SPICE模型,”Sharad Mehrotra,研发副总裁,在Digital & Signoff集团节奏.“然后,作为一个行业,我们要弄清楚如何对库进行描述,并努力将其纳入静态时序分析方法。在实现中,这些工具也认识到可变性效应,因此可以对设备尺寸、Vt(阈值电压)类型等做出正确的选择,以实现PPA给定可变性约束。类似的事情现在正在发生,设备老化成为首要问题,特别是在汽车和高性能计算等应用领域。这些芯片在数据中心环境中承受着巨大的压力,因此,对于数据中心提供商来说,能够预测这些芯片随着时间的推移将如何表现,而不仅仅是在它们刚出厂的时候,这很重要。”

图1:可靠性和PPA相互依赖性。来源:Cadence/Arm/Arm DevSummit
图1:可靠性和PPA相互依赖性。来源:Cadence/Arm/Arm DevSummit

这些问题在最先进的节点和复杂的异构包中尤其明显。Tessent集团的产品营销总监Lee Harrison表示:“随着我们越来越努力地推动设备的发展,我们正试图从我们的设计中挤出每一分计算能力。西门子数字工业软件.“我们还面临着温度和电压方面的各种挑战。这是一个古老的问题,无论何时你在设计一个芯片,你总是面临着时间边际。从一开始就不会有太多的懈怠,所以我们一直在推动技术的极限,努力让事情尽可能快地发展。”

但是最大化性能会加速老化,从而降低可靠性。如何平衡这个等式是一个挑战。“对于ic的老化有不同的观点,”André Lange指出夫琅和费IIS自适应系统工程部.“首先,技术人员想知道微观尺度上发生了什么。他们希望从如何减少设备老化的信息中得出结论,即如何使设备更加可靠。然而,在某个时间点,将没有什么可以进一步改善。这就是第二阶段开始的地方——了解剩下的不确定性和老化。这通常在技术鉴定期间进行调查。”

例如,AEC-Q100要求铸造厂调查热载流子注入、偏温不稳定性或随时间变化的介电击穿的影响。

Lange说:“设计师必须处理这种剩余的老化和退化。”“我们看到晶圆代工厂不断在其pdk中添加精度更高的可靠性模型,使设计人员能够根据应用需求调查其设计的可靠性。虽然集成电路的可靠性多年来一直是汽车领域的一个重要主题,但我们看到它在工业、医疗甚至消费等其他细分市场的重要性正在上升。设计师们越来越关注老化的影响。然而,仍有挑战有待解决,包括验证模型的可用性、任务概况的定义以及为验证设置合理的压力条件。”

一种解决方案是增加更多的定时松弛,以尽量减少电路老化对定时的影响。该公司首席执行官阿什拉夫•塔卡拉表示:“这可以通过引入更多悲观情绪来解释老龄化效应来实现Mixel.例如,通过使用感知老化的静态时序分析流程,可以添加额外的降级因子。”

汽车等高温和长寿命应用,以及人工智能等高速应用,都会加速老化效应。这使得模拟变得至关重要。

Takla说:“需要内置更多的利润率,以应对老化带来的性能恶化。”“安全操作区域(SOA)验证也是强制性的,以确保所有设备都在技术允许的最大限度内运行。在某些情况下,还需要考虑金属老化问题,然后还需要进行广泛的EM验证。”

不同的用例
设备的老化速度通常取决于不同的使用模式。过度使用通常会加速老化,但预测异构设备将如何使用并不总是显而易见的。

该公司的产品营销总监Marc Swinnen指出:“电路切换得越多,老化得越快,这对计时提出了挑战,因为电路的一部分可能比另一部分老化得更快,因为它使用得更多。有限元分析软件.“今天的方法通常是全面地考虑老化,比如整个芯片都会老化,所有东西都会老化,但这不是现实。事物的年龄是不同的,这是一件很难融入流程的事情。”

这也会影响地温梯度。需要计算局部温度,以及芯片或封装范围内的温度和焦耳自热,当电流在特定导线上引起局部加热时发生。“它们会比周围的电路温度高得多,热量会流出来。这影响了整个老龄化方程,”Swinnen解释道。

这是另一个方法论问题。他说:“老化晶体管的模型,在给定所有信息的情况下,它们是如何随着时间而老化的——这些模型已经存在,而且已经建立得很好了。”“铸造厂这样做,但这不是本质上的问题。问题是如何将这些老化信息应用到一个2亿实例的设计中,特别是因为存在差异老化。”

从物理学的角度来看,过热、过度活动和更高的电压往往会加速老化,但并不相同。例如,偏置温度不稳定和热载流子注入随着时间的推移而发生,但缓慢,而电迁移似乎加速。诀窍在于能够发现这些问题,并在正确的时间做出调整。

“为了检测它们,可以使用过程监控器,”Adam Cron说Synopsys对此.“我们有温度传感器来跟踪设计内部的局部情况。路径裕度监控器可以散布在各处,特别是在活动区域(如果我们知道该区域在哪里),以帮助发现问题,然后随着时间调整Vmin以处理差异或改变频率,或类似的事情,以处理老化和延迟。然后,在最后,也许可以定期使用逻辑BiST来捕捉灾难性的电迁移问题,如短路和开路。”

解决老龄化问题
衰老有生理和生理两个方面。西门子定制IC验证部门首席产品经理Pradeep Thiagarajan表示:“例如,电压阈值正在发生变化,源-漏通道开始崩溃。“还有许多其他现象会以不同的方式影响不同的设备,但本质上有三种主要影响最为突出——HCI、NBTI(负偏置温度不稳定性)和PBTI(正偏置温度不稳定性)。”

主要的铸造厂都意识到了这些影响,并采取了措施来解释这些影响。Cadence的Mehrota表示:“许多代工厂现在都支持相当精确的器件老化模型,即器件在特定温度和特定电压下受到压力时,随着时间的推移会退化。”“这些设备模型可以在SPICE中进行可靠性模拟。然后,如果从那里发生了相同的事件链,并且我们能够理解它,我们可以使用库描述并将静态时序分析(STA)方法放在一起。一旦我们知道如何进行STA,我们就可以进一步优化我们的实施工具,ECO, post-route等。”

图2:老化现象。来源:Cadence/Arm/Arm DevSummit

图2:老化现象。来源:Cadence/Arm/Arm DevSummit

其中一些问题是通过标准化的老化模型来解决的,该模型考虑了HCI、BTI和PBTI以及其他老化效应。西门子的Thiagarajan表示:“如果没有这一点,所有的代工厂和idm都必须严重依赖自己的国产老化模型,这代表了工艺技术的行为。”此外,EDA供应商提供不同的专有老化解决方案。晶圆代工厂需要支持所有这些多种解决方案来满足客户需求,由于缺乏通用的行业接口解决方案,他们需要支持各种模型接口来将老化的模型集成到电路模拟器中。EDA供应商还被要求为每个代工厂支持他们自己的独特接口,因此,出现了非标准方法,这增加了复杂性,增加了供应商和最终用户的支持成本。这确实需要一个行业标准的老化平台,能够进行老化建模,老化模拟和分析,以支持任何退化机制。这就产生了OMI(开放模型接口)。”

OMI始于2013年Si2 Compact Model Coalition (CMC)的一项调查。OMI的第一个版本在五年后发布,基于TSMC的TMI接口。该界面为用户提供了定制CMC标准模型以适应自己应用的灵活性,但不涉及CMC标准模型的实际本机实现。最初的目标是使代工厂、idm和EDA供应商支持单一的通用标准接口。

然而,事情并没有像计划的那样发展。每个代工厂都有不同的方法,并且对于不同的模型如何表示没有单一的标准。“除了OMI, TMI和URI是目前使用的其他类型的模型,”Mehrotra说。“重要的是模拟器可以使用所有这些模型,然后用它们进行可靠性模拟。这部分方法非常准确,并且与晶圆代工厂的硅数据进行了很好的校准。所以,铸造部分是相当完善的。目前还不确定的是使用这些代工模型的方法。”

在SPICE模拟中,这很简单。梅赫罗塔说:“你把一定的应力条件、温度、占空比、日历寿命、电压放在一起。“这是NBTI或BTI老化的四个参数。你做了一个模拟,说,'在这个日历年之后,这个日历年之后,在这些压力条件下,这就是设备老化的情况。“棘手的部分是,该设备在运行周期内并不是均匀老化的,所以你可能会对它的一部分施加一定的电压和温度,然后恢复并进行不同的操作特性,等等。”单一的模拟不会给你完美的答案。该设备面临的挑战是处理可变的任务配置。任务剖面是一个艺术术语,它表示不同的压力条件是如何随时间变化的。你如何处理一个可变的任务配置?你如何处理我们认为的PSpice线性或PSpice恒定老化剖面,也就是在这种条件下的一定时间,一定的恢复时间,在那种条件下的一定时间,恢复等等? Then, at the end of it, what does my device aging look like? Can you model all of this correctly in your STA so that you have the right aging degradation for each instance in your design? And then, can you do STA based on that?”

Ansys的Swinnen补充说,传统的方法是为零日、1年、5年和10年创建库,以确定时间。他说:“然后你就可以计算出它生命中不同年龄的循环时间,但这是假设所有东西的年龄都是一样的。”“你需要输入每个块的预期活动——比如传输块总是活跃的,但其他一些异常块很少被激活,所以它不会老化太多。这意味着在两个块之间的任何路径都将看到它的源晶体管比接收晶体管老化得多,这意味着设置和保持开始变得棘手。这并不是说他们都在追踪对方日渐衰老的角色。他们已经不同步了。需要一种方法来捕捉每个块或每个区域的活动,然后将正确的库归属于这些元素,然后使用每个块的不同计时特征集来计时。”

原则上这是可行的。斯温宁说:“只是在实践中,资金流动还不一定到位。”“这取决于你想要投入多少精力来获得可用的老化流程。还有,你在哪里捕捉到这种衰老活动?温度也有影响。你需要知道这个方块的平均温度和那个方块的平均温度,这就是你需要做的整个热分析。原则上,它是可解的。这很复杂,需要将大量数据整合到同一个位置并进行计时,这就是问题所在。”

此外,西门子的Thiagarajan表示,第一步是在没有电压或温度影响的情况下进行新的模拟。“由此,你可以从短暂分析中得到基线。第二步是在其上施加压力,例如特定应用所需的极端温度和电压条件。一旦运行,您就可以根据所使用的老化模型看到设备的退化情况,并且可以从分析中推断出年龄并将其反馈回来。第三步是在高级年龄值上运行实际模拟,以查看在正确时间信号剖面的预期退化,或下降时间,或振幅,或时钟或直流信号上的信号中的任何倾斜。作为其中的一部分,器件的自加热方面也必须考虑在内,因为每个MOS器件都可以局部加热。这也被建模了。然后,你需要评估温度的变化会如何影响衰老。”

未来
虽然仍在发展,但对于成熟的流程节点来说,大多数部分都已经到位,并且已经被很好地理解。但是在未来的节点和高级包的异构设计中仍有许多工作需要做。

Thiagarajan说:“即使是一些经过生产测试和理解的先进finFET工艺节点,碎片也在那里。”“然而,对于我们现在正在研究的更新的高级节点来说,当我们接近3nm和2nm时,它们真正突破了物理边界,用更小的通道长度,这将需要另一组创新的眼睛来正确地模拟老化,然后找到增加这些设备寿命的方法。”

但这是否会得到改善,还是会因为更多的定制、更多的选项和功能而变得更加困难,还有待观察。至少就目前而言,EDA公司正在认真研究芯片整个生命周期中需要什么。挑战在于如何扩大规模,到目前为止,还没有人谈论如何做到这一点。



留下回复


(注:此名称将公开显示)

Baidu