处理设备老化的高级节点

空白,但是了解电路的年龄和如何应对正在改善。

受欢迎程度

过早老化的电路变得麻烦高级节点,在越来越复杂的新市场需求,从热量更大的压力,由于增加了密度和薄电介质更严格的公差。

在过去,衰老和压力很大程度上独立的挑战。这些线开始模糊的原因。其中包括:

  • 在汽车,advanced-node芯片在极端环境中使用和将功能可靠长达18年。同样,在航空设备,芯片被受严寒酷暑,预计将持续至少十年或二十年。
  • 保证金,用于缓冲一些老化的原因和压力,在许多设计7/5/3nm萎缩是由于无情的要求较低的权力和更高的性能。
  • 更多的设计成为异类,提高的可能性,并不是所有在multi-chip计划将时代以同样的速度,尤其是在不同的用例和应用。

如果幸运的设计团队,问题将出现在生产和它们可以固定在芯片市场发布。但往往,问题将需要数年时间来实现电路的年龄和最终分解的东西。

“一切都正确地排队甚至开始看到这一点,它很难复制一个测试人员,因为当你取出芯片,转售,放入测试,问题消失了,“莫Tamjidi说,海豚技术的总统。“问题是暂时的。它运行了7、8或10年前你看到它。想象这是你15年前在中国北部的一个领域,在一些塔,在一个很冷的地方,运行在高电压、运行速度的最大可能。即使你有一点时间,它会工作,因为它只是减缓,如果你有一些你永远不会看到这个波动的空间。你只看到这个当你有一个非常紧张的时间预算,在最高速度在很冷的环境中,在非常高的电压。

随着时间的推移有几乎无限的失败原因。经常它始于一个组件,如IP块或一个晶体管,耗尽了规范后重复使用。这可能是由于潜在缺陷,不是在检验或测试阶段。或者,它可以从常数由于过度磨损开关由于独特的用例,或者介质击穿,导致泄漏和热损伤。失败也可以引起各种类型的压力,要么机械在锡球的情况下的角落里一个芯片造成的过度振动,或由多种电气压力。

机械压力可以导致身体上的短裤或信号中断。电压力,与此同时,可以影响排水饱和电流源电压和阈值电压,最终导致开关规格公差以外的时间延迟,根据Ashok Alagappan,咨询工程师有限元分析软件。随着动态功率密度的增加,泄漏增加,任何或所有这些会影响可靠性和可能出错的可能性增加时间和使用。

另一个问题是,在高级别,过分强调将加速老化,然而,即使正常操作会导致设备退化。

”根据类型的压力,栅氧化层可能失败,破裂,或关键设备参数,例如,阈值电压,可以改变这么多设计不再运行。挑战在于,有几种机制会导致设备退化。结果是,不同类型的过分强调会导致不同类型的老化,“艺术Schaldenbrand,高级产品营销经理,定制的集成电路和PCB组节奏,指出。

可靠性是什么?
可靠性是一个相对的概念。芯片需要执行如预期在其一生。最准确的方法来衡量,是通过在线传感器,但用例和老化也需要预先建模和模拟和测试的一个系统。

“我们可以使用手机十年了,但我们不能在实验室测量它在未来10年,“孟段说,TCAD高级应用工程师Synopsys对此。然而,方法确实存在加速退化通过加强老化条件,例如,在更短的时间跨度测量退化,如1000秒(16.7分钟)。“建模是连接的桥梁的过分强调实际使用条件,”他说。

建立一个精确的模型是必要的,经常用于TCAD工具。在电路级,老化应力应用于解决业绩不佳的芯片,减少故障率。实际上,电路是强调超出他们通常将真实世界的使用经验。


图1:模仿行为预测的可靠性。来源:Synopsys对此

“在可靠性度量,过分强调用于加速老化,“安德烈·兰格说,集团经理的质量和可靠性弗劳恩霍夫IIS的自适应系统的工程部门。“这样做是为了实现合理的测量时间。在应用程序中,过分强调可能导致突然的失败,但这是超越老化。结合过分强调和老化,过分强调的数量及其持续时间需要仔细检查,最好是基于模拟。详细调查的压力波形对安全操作区域(SOA)或老化模拟是一种可行的方法来预测过分强调对老化的影响与高水平的信心。”

过分强调可能发生在几个月或几年之后使用,导致设备故障。“热载流子注入,主要为n型MOSFET晶体管,是由电子附近的排水区域经历碰撞电离高横向电场下,获得高的动能,使他们克服Si-SiO2屏障,注入到栅氧化层,氧化生成接口或缺陷,”艾哈迈德说斋月,高级产品工程经理导师,西门子业务。”,导致阈值电压、跨导和其他特征随时间退化。同样的将洞p型MOSFET。”

负偏压温度不稳定性(NBTI),主要在p型MOSFET晶体管,是另一个问题在衰老。当一个p型MOSFET晶体管栅极电压负偏压长时间在高温下,沿着Si-SiO Si-H债券打破2接口,导致界面陷阱的一代。这些界面陷阱导致阈值电压增加和沟道载流子迁移率降低。

过程变化增加了失败的另一个原因芯片,创造新的,有时意想不到的压力的原因。任何生产过程的一部分可以受变化的影响,从接触光掩模抛光晶圆片的违规行为。在每个新节点尺寸缩小,公差缩小比例变化。不规则或潜在缺陷可能不会导致问题28 nm芯片可能会促使规范3海里之外。其他组件也会导致压力,加速老化的可预见的和意想不到的方式。

“在集成电路设计中,这可以被认为是通过结合蒙特卡罗(MC)和老化模拟同时调查过程变化的影响和stress-specific设备和电路性能的变化,”兰格说。

模型帮助
一件事并帮助是,模型从铸造厂/晶圆厂比过去更容易获得。每个预期的降解机制模型,但通常每个模型只关注这些退化机制之一。段提到的,然而,这些模型的框架可以相同或相似的。虽然衰老模型本身可能只捕获电压、温度或电流,它们可以结合在同一个框架下。

这有助于因为公差紧随着每一个新的节点,一个退化机制会影响一个或多个其他机制。但它也可能会导致其他问题的部分芯片或系统本身并不是衰老的结果。”之间的关系可以建立电路的EMI进行一个岁的晶体管模型的基础上,“说Ansys Alagappan。“换句话说,组件老化可以降低物理参数,导致对EMI敏感性增加。技术扩展并导致增加电路的电磁干扰敏感由于老化效应。”

这就是建模变得复杂,因为并不是所有都是在一个雨伞下。“今天,不同的物理机制通常是单独建模,”弗劳恩霍夫的兰格说。“角落和统计模型过程变化而退化模型捕获晶体管降解机制的影响,主要是热载流子注入(HCI)和偏置温度不稳定性(发言)。特别是从描述工作的角度来看,统计和退化模型仍是分开的,我认为这也将为其他因素。”

斋月导师的同意。他说研究人员,厂、IDMs和设计公司发展老化模型占衰老机制影响场效电晶体的关键。这些包括人机交互、发言和含时绝缘击穿(TDDB),以及为EMI互连衰老机制引入模型。

他指出,Si2紧凑型建模联盟(CMC)于2018年出台了一项标准老化模型解决MOSFET退化机制的关键。这个开放模型接口(OMI)作为平台启用模型开发者/设计者使用他们的衰老模型在不同的模拟器。

这是一个起点。但老化也是铸造和知识,这使得事情更加复杂,产品营销高级总监弗兰克铁表示IP核Rambus。“你绝对必须有正确的模型,而且每个应用程序都有不同的要求。今天的许多2.5 d系统进入网络应用程序,他们有长寿命和高可靠性要求,所以我们必须有正确的模型来支持这些类型的应用程序。”

这是特别具有挑战性的,异构的设计。萨曼萨德尔,产品营销副总裁IP核,Rambus指出,每一个铸造都有他们独特的堆垛方式死去,然后将之间的2.5 d或3 d技术和死亡插入器

”这是最大的斗争,因为这些不容易混合和匹配,“萨德尔说。“这意味着从一个IP接口提供者或芯片提供商的角度来看,你想有一个健壮的解决方案,这些工作。今天,并发症之一是,是的,你必须依靠你获得从一个铸造厂的模型。从IP设计的角度来看,我们希望确保涵盖所有应用程序。我们必须把足够的可配置性和灵活性的前提下的权力和地区IP设计,所以如果一个铸造更多一点的电阻和电容的解决方法,或microbumps有更多的硅电容从一个插入器层,它是可以管理的。影响IP的设计,所以我们都有内置的可配置性和利润率创造性地设计它不负担的设计。”

设计技术来减轻压力
从设备的角度来看,许多都与各种介质层的可靠性问题。但随着这些层变薄,单个污染物在一个或多个材料可以产生更大的影响。

为了解决这一问题的方法之一是增加监控设备。这些可以进行测量和比较它们的参考模型。

“自适应电压缩放计划可以使用这些信息来调整供应性能保持在所需的水平,”拉姆齐·艾伦说,营销经理Moortec。“信息也可以支持预测性维护,避免昂贵的计划外停机。老化是非常复杂和非常依赖用例和环境。在许多应用程序中,这些都不是总是众所周知,可以随时间变化本身。如果我们以智能手机为例,将模式在哪里做的很少,时钟频率低,供应的电压很低。在另一个极端,它可能是长时间播放高清视频在炎热的夏天。时钟将运行在高,供应将相应地高支持高时钟频率。显然如果你把设备和把它落在低功率状态,将年龄显著低于如果你把它落在大功率状态。”

问题是,在设计时,定量并不总是显而易见的。”这个例子已经实际上是一个简单的例子,因为往往会有两个以上的状态,所以你必须在每个州对时间做出假设并构建应对未知的,”艾伦说。通过允许系统来监控老化,那么可能您可以优化dvf计划,你可以预测寿命,或者甚至在某些模式控制,以确保满足特定一生。另一个例子是比特币挖掘。这是在天平的另一端,在设备制造坐在大数组。每个芯片都将随过程和他们年龄不同的部分过程变化的结果,和部分原因是它们的负载不会总是相等的。如果你可以监控所有这些条件,那么你可以优化每一个芯片运行在高峰性能。”

其他人也有类似的观点。“人们还试图优化设备结构减少退化,“段说。“在过去的几十年中,热载流子退化是一个关键的可靠性问题,和light-doped流失(LDD)过程被用来减少HCD。但现在,HCD sub-28nm再次出现,成为一个主要的可靠性问题。也是进化机制与过去相比,变得更加复杂。现在从NBTI既包含组件和热载体,而不是纯粹的热载流子。这些问题给研究人员带来更多的挑战,到目前为止我们还没有找到一个有效的方法完全移除这些退化的影响。从应用程序的角度,优化环境温度和Vdd可以减轻老化的另一种方法,但是它的性能为代价的。”

斋月导师的同意。“缓解guard-banding,通过降低工作频率或增加电源电压,实现的性能和能力。技术来减少NBTI影响实施把办公室的设备进入恢复模式,别人通过使用动态Vdd和阈值电压调优。是至关重要的精确模型所有衰老机制和运行老化模拟研究减灾技术是最有效的。”

负责提供覆盖老化故障属于集成电路设计师,Alagappan说。由他们来确定应力条件对高风险的电路,必须识别关键的晶体管制造之前,必须验证和功能使用适当的刺激条件。

“具体设计技术取决于电路的类型,但通常它使用适当的老化设备为全芯片仿真模型,并仿真方法来评估设计的利润率对老化后最糟糕的操作规范评估在所有阶段的设计验证过程中,“Alagappan说。“一些设计技术包括调整设备维晶体管不年龄。在电路的层面上,必须注意确保电压分布和操作温度的变化不会导致累积退化影响个人晶体管。”

减排技术是依赖于类型的压力导致退化,Schaldenbrand指出。“例如,添加一个共源共栅晶体管减少漏源极电压通常用于模拟增益阶段。然而,如果源退化是栅氧化层的过分强调,然后使用共源共栅帮不了。”

同时,减少压力强度是一种非常有效的方法来减少可靠性老化效应,所以定期关闭设备操作将帮助它恢复可靠性影响,解释Jushan谢,高级软件架构师的节奏。“温度影响速度或可靠性,条件设备工作温度可以降低可靠性效应”。

不过,老化从未如此具有挑战性。在数据中心电路的寿命估计是三年前被取代,而在天线和运营商级设备,它预计将持续5到10年,因为它是昂贵的交换或修复,萨德尔说。

一个需要考虑的是如何进行压力测试足够的模拟操作。在过去,这是通过把芯片放到烤箱或者让他们振动,但这些技术在先进的节点不再可能。

“压力设备模拟的方法之一,10年期效果,而设备额定功率或供应评级是相同的(设计+ / - 10%),他们强调它与它设计的高出50%到70%,这意味着功能上你必须能够维持。他们想强调它在几周或几天而不是几年,”萨德尔说。“然而,很多电路甚至功能设计用于处理信号应用于70%。另一个角度,在年前不是很好理解,每个人都认为这些场景会发生老化的实际使用设备时,事实证明,很多设备,一直生活在他们的应用程序没有前瞻性的用例。假设你有一个交换机或路由器,有10个港口。也许今天只有一个端口被部署,和其他九个港口被关闭,他们希望在五年内他们将部署系统的全部10个港口。原来停车设计一些在',' ','这些设计已经关闭或停,他们关闭,常微分信号。“对”或“关闭”的概念或微分信号是公园的一边设计“宽”或“高”,你公园另一边低。“这不是模拟特定场景,我设计的东西,它是不断交替,但现在我停车这一边”高。“这几乎就像一个机制,目的是平衡,或挂它一边高,一边低,保持了10年,然后尝试九年部署。”

避免与压力和早衰问题非常复杂,海豚的Tamjidi说。“这就像是走钢丝。你想要的平衡。如果一些电压上升太多,你必须找到可以抑制耦合或其他的东西。这一切必须调整,几乎同时,压力变得有限。它是一个迭代的过程,因为你增加一件事,然后别的变化。你改变的另一件事,和别的变化。你必须运行数百种不同的布局变化,提取,做出改变,再次运行它。它没有工作吗?再做一次。 Thicken this line. Thin that one. Put this one next to this, put that one there. You have to go through hundreds of iterations to come up with one version that works. And now for 5nm and 7nm, for every I/O you have to do two versions because the horizontal and verticals are different. You have to go through the exercise twice to make sure that both meet what you want them to.”

而模型不能精确和准确反映这些结果,他们可以指出正确的方向,他说。“我们需要的是良好的判断力,有些设备物理,和理解。模型尝试是非常保守的,尽管他们是不正确的,他们把你在正确的方向上如果你使用模型解决它,你仍然抑制问题。模型基本上说,‘别碰这个电压因为你衰老。所以你把它下来,和模型是如此保守,一旦他们说你会让十年,你可能已经做了20或30。他们不能预测如果NMOS会先死或pmo,而是因为有太多的内置安全裕度的模型,只是会议他们应该解决这个问题。”

相关的
在下面5 nm和老龄化问题
半导体老化已经从铸造到用户问题。下面5 nm, vectorless方法变得太不准确的。
电路老化成为一个关键的考虑因素
可靠性需求飙升的汽车和其他安全市场、工具供应商都集中在一个区域过去往往被忽视。
芯片的年龄如何
当前方法足够确保芯片将按预期运行在他们的预期寿命?
不同的方法来提高芯片的可靠性
推动零缺陷需要更多的在新的地方和不同类型的测试。
驯服NBTI来提高设备的可靠性
负偏压温度不稳定性会导致一系列的问题,高级节点和降低电压。



留下一个回复


(注意:这个名字会显示公开)

Baidu