中文 英语

使用分析来减少疲劳

数据驱动的方法可以显著降低制造成本和时间,但它并不完美。

受欢迎程度

硅供应商正在使用自适应测试流程来降低老化成本,这是阻止高级节点和高级封装成本增加的众多方法之一。

没有人喜欢手机在购买后的第一个月内出现故障。但是,当数据仓库服务器或汽车中的关键组件出现故障时,问题就更加紧迫了。在过去的几十年里,对复杂soc的可靠性期望一直在增长,对封装中已知良好模具的需求也在增加,特别是在强调chiplets

半导体制造商努力通过加速缺陷机制来满足制造流程末端的这些期望。老化一直是筛选早期失败的标准测试步骤。问题是它太贵了。通过结合自适应测试流程和统计后处理数据分析在美国,工程团队可以显著降低成本,有时甚至可以降低到零。

在过去的二十年里,工程师们利用晶圆探头的数据:

  • 修改老化配方,减少老化次数;
  • 筛选晶圆分拣时的可靠性故障
  • 减少接受老化的设备的百分比。

这些技术已经应用于ASIC器件和复杂的soc。工作始于21世纪初,由于CMOS工艺节点路线图上的每一个滴答声都增加静态背景电流,Iddq测试变得不那么有效,这促使了这项工作。随后,具有单个Iddq通过/失败限制的能力在yield损失和逃脱之间产生了紧张关系。工程师转向自适应测试流程和统计测试后分析来平衡规模。

就像20世纪90年代的性能绑定自适应测试流一样,那些早期的老化减少测试流涉及大量的自定义开发。在过去的十年中,数据分析公司通过提供标准化的统计分析报告,执行动态测试限制的工具,减轻了工程师的定制负担吃了,以及在晶圆、老化和封装测试步骤之间连接数据的能力。这使得即使是小公司也可以利用制造数据和自适应测试流程来降低老化成本。

“我们有一家无晶圆厂的人工智能初创公司,他们是我们整个分析平台的用户,他们之所以选择它,是因为它可以让他们专注于构建最好的芯片和系统。他们依赖于我们的产品和服务来收集、清理和管理所有数据,并迅速将信息和见解传递给他们的工程师,”Exensio Solutions的主管Greg Prewitt说PDF的解决方案.“任何一家半导体公司,无论是IDM还是无晶圆厂,无论是公有还是私有,都没有理由不能充分利用大数据和自适应测试。”

为了了解应用自适应测试来提高IC可靠性和降低老化成本所取得的进展,我们需要理解为什么老化对复杂的数字设备来说是一项必要的费用。

故障率加快
所有设备在足够的压力下都会磨损。AMD和英特尔开发的微处理器的典型寿命规格为7年。IC设备的使用寿命可能超过七年,但这并不是一个保证。

没有芯片制造商会等7年才推出更新更好的版本,但这是服务器普遍接受的寿命。电子可靠性工程师使用高温工作寿命(HTOL)过程来了解部件的早期寿命故障和功能寿命,以月和年为单位进行测量。可靠性工程师通常将其称为浴缸曲线。HTOL利用了这样一个事实,即固态器件磨损机制(又名老化机制)可以通过在其正常工作范围以上延长一段时间施加温度和电压来加速。CMOS老化机制包括负偏置温度不稳定性(NBTI)、热载流子注入(HCI)、电迁移(EM)和随时间变化的介电击穿(TDDB)。

图1:“浴盆曲线”风险函数(蓝色,上方实线)是早期失效风险降低(红色虚线)和磨损失效风险增加(黄色虚线)的组合,加上随机失效风险不变(绿色,下方实线)。资料来源:维基百科

图1:“浴盆曲线”风险函数(蓝色,上方实线)是早期失效风险降低(红色虚线)和磨损失效风险增加(黄色虚线)的组合,加上随机失效风险不变(绿色,下方实线)。来源:维基

仅在评估过程早期表现出来的缺陷被称为婴儿死亡率失败。在CMOS中,氧化物针孔和用于电迁移的窄金属线是经常导致婴儿死亡的物理缺陷的例子。

对于所有硅产品,工程师使用HTOL进行新产品介绍评估。对于大型SoC设备,使用HTOL作为生产步骤已经成为业务的一部分。在后一种情况下,工程师将这个测试流程步骤称为老化。

老化模块由温度控制室和pcb组成,pcb可以控制IC器件的功率。将老化步骤置于生产测试过程中会导致以下成本:设备、工厂占地面积、能源和制造时间。由于存在较少的并行性,老化室的吞吐量明显低于用于晶圆探针和最终测试的测试单元(组合处理器、ATE和相关软件)。测试流程最初需要在老化之前和之后进行ATE测试,参见图2。ATE和burn-in chamber的成本分别为7和6位数。

图2:生产老化流程。资料来源:Anne Meixner/Semiconductor Engineering

图2:生产老化流程。资料来源:Anne Meixner/Semiconductor Engineering

这些成本促使工程团队降低这些成本,或者完全消除这些成本。

选择晒什么,怎么晒
利用晶圆测试数据,工程师修改了烧灼配方,确定了烧灼后最可能失效的部件,并完全消除了烧灼。为了支持CMOS中的此类决策,设备测试工程师主要依赖Iddq测试测量。要了解其与早期生活失败的关系,需要了解Iddq测试。

硅的缺陷可以通过多种方式表现出来。依靠老化来加速故障,允许卡在故障((电子邮件保护)(电子邮件保护))测试,以便事后发现故障。随着CMOS成为计算设备的主要工艺,使用Iddq测试筛选故障成为测试工程师工具箱的一部分。它可以检测故障测试遗漏的故障模式,其中包括早期可靠性故障模式。

Iddq是静止电流的测量。它是在输入刺激被应用后测量的,而不是在应用过程中。缺陷导致Iddq值升高。从1985年左右开始,产品和质量工程师开始在晶圆测试中使用Iddq测试,以实现0%的生产损耗。对于这些工艺节点,缺陷导致Iddq值比无缺陷器件至少高一个数量级。因此,工程师可以相对轻松地设置通过/失败限制,成功筛选可靠性故障,而不会造成重大的良率损失。

如前所述,收缩过程节点使其效率降低,因为静态电流增加,静态电流分布变宽。工程师们以创造性的方式回应这些事实,继续使用这一测量作为屏幕,至少有一个工程团队巧妙地使用增加的电流来减少老化时间。两者都使用自适应测试方法和流程来实现它们的目标。

漏水的部件意味着更高的功率,因此,更高的热阻,这就意味着更短的老化时间。英特尔工程师利用这一特性来缩短老化时间。在一个2006年创新科技署文件,英特尔研究人员描述了评估每个晶片的静态电流和其他晶圆测试测量,以确定最佳的老化配方(时间,温度,电压)。接下来,一个自动前馈测试流程将模具导向几个不同的桶,每个桶都有一个优化的老化配方。通过静态功率分离成桶,减少了所需的应力时间,并减少了每个桶内应力温度的总体变化。

英特尔实现了惊人的老化时间减少-超过90%的大容量90nm产品。然而前馈测试流并不是缩短时间的唯一因素。一个新的老化设备单元使用槽结构使每个老化板具有这种级别的隔离,允许单个老化控制老化室中的功率和时间。对于后者,新电池避免了批量处理,因此连续处理老化板进一步优化了老化配方桶。

图3:英特尔自适应老化配方流程。来源:Anne Meixner/半导体工程

图3:英特尔自适应老化配方流程。来源:Anne Meixner/半导体工程

Iddq电流的巨大变化给想要提高其有效性的测试工程师带来了一个问题。即使在21世纪初引入了delta-Iddq电流测试技术,要平衡产量和质量也变得非常困难。

与固定测试不同,Iddq工程师有一个数值来检查极限。有了数值,您就可以应用更高级的统计方法来识别缺陷。

图4:自适应测试流程,以降低极有可能失败的模具老化。来源:Anne Meixner/半导体工程

图4:自适应测试流程,以降低极有可能失败的模具老化。来源:Anne Meixner/半导体工程

在其2002年超大规模集成电路测试研讨会论文, LSI工程师和PSU研究员分享了他们如何使用晶圆测试数据的后处理和晶圆排序图来识别可能的可靠性故障和客户可见的逃逸。在与老化相关的测试中,他们查看了Iddq数据,以确定最有可能无法老化的部件。报告了0.18 μ m产品的结果,他们描述了一个测试流程,需要在晶圆排序后和最终测试之前做出有关烧灼的决定。

作者指出,对Iddq进行单阈值测试限制会导致边缘模具被标记为失败。然而,他们只是死得更快,而不是有缺陷。他们观察到,绘制Iddq与速度测量值的关系,“显然异常值是可见的,但在不造成高产量损失的情况下,在测试仪上设置限制变得很困难。”他们用一系列统计分析方法对晶圆级测试数据进行后处理,以确定极限(又名虚拟测试),从而解决了他们的困境。

使用统计方法,他们根据晶圆位置和晶圆测试结果总体将通过所有简单测试限制的模具降级为被认为可疑的部件。无论是磨合还是屈服,他们的结果都是令人信服的。为了评估在减少老化方面的改进,他们进行了一项实验,使用14个批次和总共60105个晶片通过晶圆排序,将所有降级的晶片和一个未降级的晶片样本进行24小时的老化。在171个老化故障中,他们的统计降级方法确定了其中的168个。

随着这些方法的知识传播开来,IBM和德州仪器等其他公司的工程师开始将这些方法应用到他们的产品中。他们发现这种方法很有吸引力,因为它可以通过消除老化或降低产品老化的百分比来节省成本。他们不顾工程投资来应用复杂的统计分析和创建定制工具来管理整个工厂的产品流。

平衡过度捕杀和猎杀不足
那么,LSI团队是如何做到的呢?他们使用多变量和严格的统计分析方法来区分好骰子和坏骰子。

从参数测量建立单一变量的通过/不通过限制总是有统计风险第一类和第二类错误

在集成电路制造。工程团队从不使用统计学术语。人们可能听到的等价术语有:

  • 第一类错误=过度杀伤,失效的好部件,产量损失。
  • 类型II错误=未击杀,传递坏部件,逃脱。

在测试制造过程中,尽量减少过度和欠压分别决定了产量、质量和可靠性。对于先进的CMOS工艺节点,在生产启动时设置单一限制忽略了两个事实——分布随着制造工艺的健康和成熟而变化,并且在单个测量值周围存在更高的变化。对于后者,工程师可以称之为处理噪声数据的问题。使用统计分析方法允许使用多个测量和骰子属性(地理空间)来识别异常值。在这些更复杂的通过/失败统计决策中,过度杀伤和不足杀伤仍然存在,风险变得更小。

老化结果与晶圆和最终测试数据相结合,使德州仪器的工程师能够建立非常有针对性的统计分析模型irps2006文件与PSU的Rob Daasch共同撰写。

“老化数据与Iddq数据相结合是一个非常丰富的信息来源。不仅仅是在电压压力和对老化压力的响应方面,特别是因为你可以用离群值识别技术来做事情。你可以做应力前和应力后Iddq测量,计算delta,并寻找运动,”Ken Butler说,他是IEEE院士,也是德州仪器的前测试系统架构师。“然后你可以通过一个离群值算法运行所有数据,找出微妙的机制,因为当你进入老化状态时,这些数据会突然出现。为了避免老化,你必须预先排除可能出现故障的设备。”

当然,这并不完美。巴特勒说:“你不可能抓到所有的东西。”“在早期(大约2002年至2006年),当我们的目标是避免或最小化大型数字SoC设备的老化时,我们可以使用唯一的模具ID来跟踪整个老化过程和最终测试。如果烧制后失败,您可以查看晶圆数据来开发屏幕。例如,这片晶圆上发生了5次老化故障,去找一个相关参数,让我可以预测这些故障。”

其他人也同意。“制造数据的复杂性和数量的增加,以及提高质量的需求,不仅导致了对高效数据管理平台的需求,还需要复杂的分析解决方案,”阿隆·马尔基(Alon Malki)说国家仪器.“将老化结果与一小组测试参数相关联已经不足以用于筛选目的。工程师们现在需要考虑分析制造过程中多个阶段的数千个参数。为了应对这些新挑战,我们必须审视整个产品生命周期的数据。”

对于先进的工艺节点(< 14nm), Malki指出,将先进的分析方法应用于大数据,制造工艺可以降低高达40%的老化成本(回想一下,对于90nm,英特尔通过更简单的分析和自适应测试流程实现了90%的成本)。但要实现这些节约,需要考虑到设备的整个生命周期,从模型创建到分布式部署,再到模型性能的持续监控,并且需要能够快速适应变化。

虽然idm拥有开发定制工具的工程资源,但这种投资需要持续的维护和开发。因此,专门为这些分析方法和智能制造流程提供框架和工具的公司一直在增长。

PDF的Prewitt说:“生产过程越来越复杂,分布在多个设施和操作小组中。“就像这种分布带来了物流挑战一样,它也使及时收集和校准数据源和类型变得复杂。解决这些挑战得益于直接在处理工具上收集数据,自动化及时的数据传输,并为这些相关但不同的数据源建立一个单一的数据存储库,以便将其合并为产品工程的单一真实来源。”

结论
对于复杂的SoC设备,需要老化步骤来满足最终用户的高可靠性要求。这是一个成本高昂的制造步骤,测试工程师希望消除这一步骤,但负责可靠性度量的工程师会谨慎地监督这种消除。良率损失和质量之间的紧张关系贯穿整个制造测试流程。

以经济的方式满足这两个指标是产量/质量/成本三角形中的第三个点。测试和可靠性工程师可以一起使用自适应测试流程和复杂的统计分析来有效地满足他们各自感兴趣的指标。从历史上看,这些工程努力只能由拥有大型工程团队的硅公司实现。

巴特勒说:“有人可能会说,在低产量的情况下,情况可能更糟,因为你要承担创建测试设置、维护设备等所有开销。”“当你可以在更大的材料上摊销时,也许这是可持续的。但现在,如果你是一家小公司,你就必须创造所有这些东西。”

然而,每个人都应该从这些方法中受益,这一点已经改变了。在过去的5到10年里,理解硅制造测试专业知识的分析平台为工程师提供了分析工具。

复杂的制造设计,加上复杂的集成电路设计,需要使用多个变量来观察其中一个与另一个的不同。配备了数据、分析工具和更自动化的测试流程的工程师现在可以完成这些工作。



3评论

BillM 说:

减少或完全消除燃烧
MFG流程从70年代后期开始实践
80年代初。这是其中一份工作
产品工程师会执行。PEs是
负责满足所有的预期产量和
因此成本从硅制造到零件时
发货。PEs进行了各种研究/分析,以确定是否以及如何实现这一目标。
他们还决定了如何提高速度
的销售价格
更高频率的芯片。

今天,有软件可以帮助实现这些目标。

安妮Meixner 说:

BillM,

感谢您的分享,消除老化一直是一个焦点,自20世纪70年代末。

产品工程师在平衡成本、产量、质量这三个三角方面有很大的责任。

我报道了你在2020年12月指出的快速装箱。

感谢阅读并留下评论。

钱德拉 说:

谢谢你!你已经用精确的方式解释了工程方面的工作。

留下回复


(注:此名称将公开显示)

Baidu