中文 英语

半导体老化的原因?

为什么这正在成为一个更大的问题,以及可以做些什么来减轻影响。

受欢迎程度

半导体技术已经发展到没有人能认为芯片会永远存在的地步。如果不仔细考虑,老化会缩短IC的寿命,低于预期应用的需要。

技术圈对老化进行了很好的研究,但其他不太直接参与的人可能在一般层面上理解这是一个问题,但原因并不总是那么明显。那么,衰老背后的物理机制究竟是什么呢?

“老化本质上取决于我们在晶体管通道中驱动电子的速度有多快,”AMS的产品管理主管Sathish Balasubramanian说西门子EDA

这反过来又导致了一系列的权衡。“从设计的角度来看,几乎每个设计师都对老化方面的不同东西感兴趣,”André Lange说夫琅和费IIS自适应系统工程部

尽管如此,它的地位已上升为一个关键的核查目标。“我们一直专注于PPA,”Balasubramanian说。“应该是PPA2,”这需要考虑四个关键因素——性能、功率、面积和老化。

目前已知的缩短芯片寿命的影响只有少数几种,其中许多都涉及到电荷被困在了不属于它们的地方。有些问题可以通过技术改进来缓解,而另一些则需要仔细的设计和验证。老化模拟已被证明是一个很大的帮助设计师,但没有快速和简单的解决方案。最终,芯片内监控可以帮助在系统老化时密切关注系统。

为什么我们现在担心衰老
电路老化一直存在。然而,在过去,硅和其他材料所能做的事情一直有更多的空间,而很少有突破极限的空间。“衰老效应和退化机制在理论上一直存在。proteanTecs.“我们开始看到的是它们在高性能应用程序中的广泛表现,比如数据中心。大型超标量正在报告他们不习惯看到的计算故障和随机缺陷。我们预计,随着设计规模的缩小、技术节点的进步以及性能和可靠性需求的激增,这一趋势将会增加。”

在过去,由于老化而导致的设备故障可能会在芯片的预期寿命后很长时间出现——如果有的话。然而,随着节点的攻击性越来越强,材料被推得越来越重,出错的空间也越来越小。老化可能发生得更快,如果处理不当,设备的预期寿命甚至比预期系统的寿命还要短。

虽然半导体老化可以影响任何应用,但有一个市场比其他任何市场都更关注它。“汽车是在设计中考虑设备老化的主要驱动力,”Fraunhofer的Lange说。

这是由两个因素造成的:汽车的寿命必须比普通智能手机长得多,故障可能会带来安全后果。因此,原始设备制造商和一级供应商不得不认真研究老化的影响,以及如何保护系统免受这些影响。

但除了汽车,任何需要长时间使用的芯片都将受到影响。巴拉苏布拉曼尼亚说:“我们正在尝试做城市规划,比如污水控制系统、工业物联网中的关键任务,或者边缘系统,在这些系统中,给定芯片的每个终端应用都决定了如何增强它们的老化能力。”

虽然有很多关于如何减轻衰老影响的信息来源,但很少有人深入研究衰老的根本原因。目前还不清楚带有电子的稳定材料会以某种方式磨损。事实证明,导致衰老的影响相对较少,大部分与移动的电子在遇到物体时传递的能量有关。

金属迁移
第一个已知的影响是一个古老的影响,可以追溯到几十年前。这里的问题是,当金属离子在导体中碰撞时,电子确实可以推动金属离子。这种影响是逐渐的,但是随着时间的推移,导体中会出现缝隙。即使没有完全断开连接,它的阻力也会随着变窄而增加。

这种效应是由电流密度驱动的。随着空隙的形成,这就产生了一种正反馈效应。电流密度与通过导体横截面的电流大小有关。如果导体被缩窄电迁移时,可用截面减小,增大电流密度,使问题恶化。

缓解包括管理当前的密度。可以通过增加金属横截面(通过加宽金属,因为高度是固定的)或降低电流来减小电压。长期以来,模拟工具使得运行检查以确保电流密度在整个设计中保持在范围内成为可能。

还有另一种形式的金属迁移可能是问题,也可能不是问题。金属-介电界面可能是物理应力的来源,这可能导致金属移动。这是双大马士革铜工艺早期的一个问题,沿金属壁的应力。

这通常被认为是一个固定的问题,但目前尚不清楚它是否会在最具攻击性的节点上再次抬头。

被困电荷的影响
导体和绝缘体的概念简单地假设,载流子只在导体中移动,而绝缘体在电上是惰性的。虽然这可能是真的,但普遍存在的困住电荷的问题违反了这一原则。

被困电荷是一种以某种方式嵌入在绝缘体中的电荷。它可能会移动,但它最有可能呆在原地。因为这些电荷是不可移动的,它们不会参与任何直接的电流流动,但它们会导致泄漏,最终导致击穿。

电荷俘获在很大程度上是一种不受欢迎的现象。虽然一些应用程序,如闪存,可以利用电荷捕获作为存储机制,但它在其他方面没有帮助。

陷阱可以被认为是吸引和持有电子的缺陷。这在栅极电介质中是最大的问题,在栅极电介质中,困住的电荷会影响阈值电压。它们还使海峡中的运营商更容易通过闸门。

有内在陷阱,是在制造过程中产生的,也有外在陷阱,是在操作过程中产生的。由于后者,困住的电荷会随着时间的推移而积累,这才是导致大多数老化的真正原因。

内禀阱可能由介电的不完全形成和介电与硅之间的界面产生。在电介质中,只要绝缘体的晶格有缺陷,电荷就会被困住。

虽然有可能种植高质量的氧化物,但它所花费的时间可能会使这种过程不经济。兰格说:“当你有良好的栅极氧化物时,内部就不会有太多陷阱。“尽管如此,要获得这些优质的门氧化物还需要付出更多努力。”

由于所涉及的温度和时间,退火可能是不实际的,这取决于一个人在过程中的位置。Lange指出:“是否可以进行高温工艺步骤总是取决于之前的工艺步骤。”“一些高-Κ电介质并不喜欢高温。”

现实情况是,电介质中总是会有一些缺陷。

界面上的陷阱
在硅界面上,会有开放的,或“悬挂”的硅键。这些是用氢钝化的。但并不是每一个悬着的债券都能被填补,剩下的将是陷阱。

此外,通道上的孔洞可能会诱使氢离开它的位置,打开一个陷阱。西门子EDA模拟和混合信号产品工程总监Ahmed Ramadan表示:“这主要是因为位于氧化硅界面的硅/氢键断裂。”

一般来说,疏水阀将取决于用于防止泄漏的材料和添加剂。从二氧化硅到氧化铪(或其他高-Κ介质)的转换并没有消除固有的陷阱。

这些缺陷不会造成问题,除非有电子进入其中。即使这样,单个被捕获的电子也不太可能被注意到。老化效应与这样一个事实有关,即一旦被捕获,电子可能很难被移走,这可能是一种累积效应。

以下是电荷俘获的具体原因和影响,它们有不同的名称,这取决于它们的影响。虽然它们在主流应用程序中占老化的大部分,但一些应用程序(特别是那些必须在严格的空间条件下生存的应用程序)可能有其他贡献。

Lange指出:“例如,由于阿尔法粒子,你会有单一事件的中断。“由于高能离子,你还会出现永久性退化,所以总电离剂量也是一个问题。”

热载流子注入
电流中的载流子将具有能量分布,其中一些载流子将比其他载流子更有能量或“热”。这些载流子会导致电子穿过相邻的绝缘体,将自己嵌入(甚至制造)陷阱中。这称为热载流子注入(HCI)。

莱马丹说:“热载流子注入是由于排水管一侧的高电场造成的。“这个高电场实际上会推动电子获得足够的能量,与硅晶格原子碰撞,并产生电子/空穴对。对于NMOS器件,孔通常会通向衬底。电子会被推向硅/二氧化硅界面。它们会与其他硅原子碰撞,产生更多的电子/空穴对,这种效应被称为“撞击电离”。’这些电子要么停留在二氧化硅界面内,要么通过栅极。”

当漏极电压相对于栅极较高时,这往往是一个更大的问题。拉马丹指出:“据说当漏极电压是栅极电压的两倍时就会出现问题。”

图1:高能载流子撞击硅原子,产生电子/空穴对,电子被困在附近的电介质中。新的电子可能会在这个过程中形成其他电子对。这些孔会向基板移动。资料来源:Bryon Moyer/Semiconductor Engineering

图1:高能载流子撞击硅原子,产生电子/空穴对,电子被困在附近的电介质中。新的电子可能会在这个过程中形成其他电子对。这些孔会向基板移动。资料来源:Bryon Moyer/Semiconductor Engineering

这种机制显式地用于闪存编程的一边。除此之外,这是一种不受欢迎的现象。

负偏置和正偏置温度不稳定性
这是一种可以逐渐降低晶体管阈值电压的效应。负偏置温度不稳定性(NBTI)会影响PMOS晶体管,并且随着时间的推移越来越受关注。阳性版本(PBTI)影响NMOS晶体管,也被考虑用于侵略性节点。这两种情况在高温下都会加剧。

对于NBTI,捕获载体的陷阱可能有两个原因。一是在栅极电介质中存在固有的陷阱。这也是PBTI背后的主要机制。

NBTI俘获电子的另一个来源是在沟道/氧化物界面。与涉及热电子的HCI不同,这些现象导致电子在电场的影响下缓慢地漂移到并通过栅极电介质。请注意,这方面不被认为是影响PBTI的机制。

这些电子改变了晶体管的阈值。拉马丹说:“阈值电压将下降,这将影响电路的整体延迟,这将变得更糟。”

图2:载流子(蓝色圆圈)从硅漂移到电介质。黑色圆圈是陷阱,其中一些已被占领。资料来源:Bryon Moyer/Semiconductor Engineering

图2:载流子(蓝色圆圈)从硅漂移到电介质。黑色圆圈是陷阱,其中一些已被占领。资料来源:Bryon Moyer/Semiconductor Engineering

如果氧化物上的电压被移除,大容量阱捕获的电荷可以随着时间的推移逐渐释放。拉马丹说:“如果制造过程中存在陷阱,它们将被填满漏洞。”“当你消除(电压)压力时,它就会消失。”

从理论上讲,PBTI和部分NBTI可能是可逆的——这使它们不是真正的衰老问题。

但是解除电荷捕获的放松时间可以从毫秒到小时不等。从集成电路运行的时间尺度来看,这些都是很长的。这意味着,即使这种效应在技术上可能是可逆的,但在某些电路中可能没有机会这样做。在这种情况下,它还有效地充当老化机制。

不太清楚界面陷阱是否会释放电荷。“与硅/氢键对应的孔洞碰撞产生的陷阱。去除氢键会留下一个悬浮的硅键。”莱马丹说。“这些都没有恢复。”

换句话说,即使应力消失,氢也不会回到原位。

Lange说:“NBTI/PBTI和HCI对电路设计人员来说很重要,因为它们都会导致晶体管性能的逐渐转变,从而导致电路性能的逐渐转变。”

增加泄漏
电子穿过电介质的另一种机制是隧穿,Fowler-Nordheim隧穿是一种非常具体的机制,通过电介质的电压使隧穿势垒变窄。电压越高或氧化物越薄,电子就越容易通过。

图3:Fowler-Nordheim隧穿的简化能带图。在左边,没有施加电压,势垒太宽,无法通过。在右边,在施加电压的情况下,较薄的部分可以允许隧道。资料来源:Bryon Moyer/Semiconductor Engineering

这种效应被有意地用于原始的电可擦除可编程rom (E2PROMs),并且仍然用于使用浮动门的位单元的flash编程机制的一侧(使用HCI用于另一侧)。但是只要有电压穿过薄的屏障,隧道就会发生,不管是否需要。

这些电子可能会被途中的缺陷捕获,这意味着它们可能无法穿过电介质。但它们确实降低了进一步隧穿的势垒,这可能会导致通过电介质的泄漏电流增加。

随时间变化的介电击穿
当更多的被困电子积聚在电介质中,其整体击穿电压下降。当电荷缓慢积累时,在某一点上形成“渗透路径”,使电介质失效。这会导致“随时间变化的介电击穿”(TDDB)。

与典型的老化机制不同,这意味着有一个突然的故障,而不是逐渐降低性能导致故障。虽然这种效应已经被建模,但对于某些设计来说,模型可能过于保守。

Lange说:“我们在射频领域的合作伙伴告诉我们,静态TDDB模型可以预测电路在接通后立即故障。”实验表明事实并非如此。问题是,高电压尖峰的速度如此之快,以至于它们不会导致这种高度的直流应力所造成的破坏。”

模型没有很好地捕捉到这一点,因此在射频设计过度受限的情况下,需要做更多的工作。

温度循环疲劳
先进的包装它带来了独立于个人死亡的挑战。Hutner说:“在讨论退化和老化源时,我们需要考虑的另一个因素是先进的异质包装。“这意味着我们实际上是在扩展‘衰老’一词,将新现象包括进来。”

在复杂的多芯片封装中,存在多种具有不同热膨胀系数(CTE)的材料。这意味着随着温度的变化,材料会以不同的速度膨胀和收缩。随着时间的推移,这些差异可能会导致金属连接失效而导致不连续。

如果在设计中没有充分解决这种长期的温度循环,具有机械元件的设备(如MEMS芯片)也可能存在内部故障。这种故障将导致精度下降或设备完全死亡。

分析前期设计,监控后期设计
虽然了解底层机制有助于减轻芯片的老化影响,但分析工具应该抽象出细节。这些工具的质量将取决于它们使用的模型的质量。

莱马丹指出:“如果设计师想把他们的设计推向极限,他们需要确保他们有良好的模型来捕捉这些可靠性效应。”“大多数铸造厂实际上都热衷于在他们的模型中使用NBTI和热载流子注射。我们还看到了专门用于汽车应用的TDDB模型。”

但验证年龄并不是按下按钮那么简单。兰格警告说:“这些模拟取决于你所使用的任务配置文件。“这个电路是干什么用的?”什么是关键或典型的使用条件?另一个问题是,使用哪些模型来模拟设备退化或电路性能的影响?这些模型必须支持模拟中的其他瞬态波形。他们必须准确地评估你感兴趣的静脉曲线图上的所有点。”

随着人们对衰老的了解越来越多,这些模型应该得到更新,从而更容易围绕衰老进行设计——即使每一代人的影响都越来越糟。

兰格说:“即使对于非常非常小的节点,对物理上发生的事情的基本理解也已经相当好了。”“但要使这些模型适用于不同的技术或不同的晶体管类型,还有很多工作要做。”

硅前验证虽然至关重要,但还不够。老化是高级集成电路中包含监控电路的主要原因之一。Hutner表示:“soc需要智能化,嵌入智能监控解决方案,以便对其健康状况和性能下降预测提供实时反馈。”

关键参数可以被观察,分析可以指向可能因老化而故障的设备。在适当的情况下,这些芯片或焊接芯片的电路板可以在它们的故障导致更大的问题之前更换。

这样看来,衰老效应将会持续下去。但是,在设计验证以减缓老化和实时监控以观察老化过程之间,系统可以得到更好的保护,因为它们在我们的生活中越来越普遍。



6个评论

贝塞尔函数 说:

如果我没记错的话,电线键合也有磨损的问题。界面金属化会降解。紫色瘟疫将继续增加,即使在金属系统,这种现象不应该是一个问题。贝塞尔

大卫利瑞 说:

我很喜欢读你的文章。你说的没错,尖端硅技术面临着节点间磨损裕度侵蚀的挑战。生命周期中有一次失效分布,由于多于缺陷。随着可靠性裕度的下降,晶圆工艺变化可能导致早期磨损故障。例如跨晶圆、晶圆与晶圆、批次与批次图样、薄膜厚度和化学计量差异。关键的老化机制是热驱动的。由于模具上的热点很常见,在许多情况下会在模具上产生数十度的温度差异,晶圆加工中的差异可能会导致早期寿命故障。对于性能优化的电路设计,我主张生产可靠性屏幕(例如老化)需要提供足够的应力水平,不仅可以激活早期生命潜在缺陷,而且还可以识别由于晶圆加工差异而导致的早期磨损故障(例如< 10年)风险。

说:

大卫,你说得完全正确。我是一个小节点的集成商,我不买自己的产品。我知道所有的晶圆厂和工具都有工艺差异,但随着特征尺寸的减小,它变得更加致命。而且缺陷变得令人讨厌,完全无法检测。我可不想因为一次愚蠢的故障把手机弄丢

简•霍普 说:

这是我见过的最好的解释。我看了报纸,迷路了。由于1月

Arnaud PHELIPOT 说:

谢谢你这篇非常有趣的文章,让我想起了我长达十年的工作。

我补充说,对于所有这些失效机制,模型(大多数情况下是阿伦尼乌斯定律)及其参数在半导体社会中是众所周知的和一致的。
如果您参考JEDEC JEP122H出版物,您可以获得所有这些故障机制的模型物理定律和参数,这些参数可以帮助您在用户方面对您的半导体部件与您的任务配置文件进行验证(或使用半导体制造商的结果来做到这一点)。
然而,你可以看到该出版物自2016年以来就没有更新过。这是因为当进入深亚微米(低于45/32nm)时,根据制造商(FinFET、GAA、平面+ SOI衬底、材料堆叠)的不同技术选择开发了不同的领先节点,这打破了模型和模型参数的协议。这就是我在Lange的引言中所理解的,“但是要使这些模型适用于不同的技术或不同的晶体管类型,还有很多工作要做。(这适用于III-V半导体,光学电子等)

因此,故障物理模型变成了依赖于过程的东西,如果不是依赖于代工,它的知识对业务来说是至关重要的,因为它可以决定一项技术的能力,以解决从手持设备到太空系统的各种应用。

兰格说任务轮廓是完全正确是至关重要的(下一辆车罩部分将看到温度高于客舱电子、汽车将只有大约5000小时在其整个一生而民用航空器将每年在相同数量的时间),但评估产品的生命的终结,它能够被用于系统还需要一个好的知识的具体技术。

有关寿命预测和模型的更多信息,您可以阅读由Pr Bernstein参与的喷气推进实验室的好文件:https://nepp.nasa.gov/files/16365/08_102_4_%20JPL_White.pdf.这是对模型很好的科学介绍。

Arnaud

菲尔·霍利斯 说:

感谢你的精彩总结,让我回忆起44年来半导体制造的一些挑战时期。

留下回复


(注:此名称将公开显示)

Baidu