中文 英语

一次测试并不总是足够的

结合两个测试参数来做出通过/失败的决定变得越来越容易。

受欢迎程度

为了提高产量、质量和成本,可以将两个单独的测试参数结合起来,以确定零件是否通过或不合格。

通过这种方法收集的结果更加准确,可以让测试和质量工程师更快地发现故障部件,发现更多的测试逃逸,并最终提高成品率,降低制造成本。新的数据分析平台,加上对统计衍生值的更好利用,使得这种方法比过去更容易实现。

最近的测试进展是基于面向缺陷的方法,它超越了包含数据表的标准测试。这对于用于汽车、医疗和航空航天等安全关键应用的半导体器件尤其如此。使用如下方法部分平均检验(PAT/DPAT),工程师对电气测试值进行简单的统计。

但是这些方法不再足以发现系统测试失败和早期生命失败(也就是潜在缺陷)。此外,PAT限制仍然会使良好的部件失效。

“静态和动态PAT方法都不够敏感,无法将具有潜在缺陷的集成电路与自然工艺变化分离开来,”Alex Burlak说proteanTecs.因此,具有潜在缺陷的集成电路会逃避生产测试,并随着时间的推移在现场失效。”

更复杂的统计方法着眼于缩小人口,考虑使用一个骰子及其最近的邻居。但如果将两个参数检验结果结合起来寻找异常值,则可以进一步改善结果。这有效地减少了测试逃逸和潜在的缺陷。此外,它利用现有的测试,这就否定了需要在整个测试程序确认过程中运行的新测试的开发。两个测试值一起可以更好地区分好和坏的模具/单元。为了有效地做到这一点,工程师需要数据分析工具来帮助识别有效的测试对值,建议通过/失败限制,并验证他们产品的大量历史数据。

“许多常用的数据分析平台都预先配备了可靠的异常值检测方法,可以很容易地应用于任何数据集,”软件产品管理总监Mike McIntyre说上的创新.“一些更复杂的系统甚至允许它们以各种逻辑(和/或)组合使用。”

两次考试总比一次好
组合两个测试可以增加价值,但实现起来并不简单。从根本上说,一个好的设备和一个坏的设备表现出不同的电行为。测试程序包括一组测试,以利用这些差异。是否有较大的片上系统(SoC)测试与80%的数字电路,或一个小型射频设备与修剪和一长串模拟测试,可用的参数测试值的范围可以从数万到数千。

不良器件是由于工艺偏差、大于预期的模具内工艺不匹配或缺陷造成的。理论上,一组单独的测试可以检测到所有的故障。但通常情况并非如此。在晶圆测试时,不良零件会被遗漏,并可能导致现场故障。此外,严格的合格/不合格限制可能会导致许多好部件不合格,这增加了总体成本方程。

结合两个测试值可以有效地解决这些问题。工程师们发现这种方法在防止现场返流方面非常有效,通常在百万分之数十到百万分之数百之间。实际上,确定产量提高的根本原因远不如找到一种检测烦人的测试逃逸的测试重要。

但是哪些测试以及如何组合这些值?从20年前开始,工程师们开始关注代数组合——减法和除法。这些经典的测量技术去除了背景噪声,这实际上是在晶圆测试中观察到的工艺变化的预期范围,从晶圆到晶圆和批次到批次。

IDDQ测试的发展就是使用这种技术的例子。在千禧年之初,亚微米CMOS工艺导致泄漏电流的变异性更高。工程师们预见到,具有特征极限的IDDQ测试将不再有效。然而,对于数字电路,他们看重IDDQ检测漏出缺陷的能力生成时间模式。这促使工程团队进行调查,并最终使用多个IDDQ测试值来区分好部件和坏部件。他们减去两个在不同电压下测量的IDQQ值。他们还使用了两次IDDQ测量之间的比值。因此,他们在一次代数运算后使用了两个测试值。

使用两个不同的模拟参数,如增益和直流电平,或直流电平和背景电流,他们可以找到异常值。对于某些测试对值,有缺陷的部分和良好的部分将通过各自的确定值。但对于某些缺陷,如果两项测试具有较强的相关关系,则可以发现差异。这种关系可以使用标准线性回归技术将原始数据拟合到一个方程中(例如,Y = aX+b)。

通过绘制两个高度相关的值,异常值就会显现出来。如果一个模具/单元明显偏离生产线,工程师已经找到了一个有效的测试值组合。


图1:二元离群图及相关晶圆图。来源:国家仪器

为什么两个不相关的测试值会检测出有缺陷的部件?“当你发现相关性时,每个人都希望有一个绝对容易理解的相关性存在的原因,”特朗普的战略业务创建经理肯•巴特勒(Ken Butler)表示美国效果显著.“我们曾经试图解释为什么这些测量可以发现这种缺陷。有很多半导体物理学在起作用。但实际上,它可能是多种情况中的任何一种。”

有了客户退回的部件,工程团队就可以专注于寻找检测手段。大多数油田的回收率为百万分之数十或百万分之数百。确定提高产量的根本原因不是重点领域。事实上,基于两个值的通过/失败判断可能会导致一些好的部分失败。如果不是重大的良率损失,工程师会修改测试程序,使用新的及格/不及格限制。

通过采用两次测试测量方法,新的极限对正常过程变化表现出鲁棒性。然而,有时这还不够好。在过去的10年里,一些工程师已经转向使用统计值而不是测量值,用大于中位数或平均值的两个标准差来表示合格/不合格限制。这与PAT或DPAT有很大的不同,这两者都基于统计分析设置了测试值通过/失败的限制。

Exensio solutions的主管Greg Prewitt表示:“对于异常值检测,人们最不了解的一个方面是如何对结果进行数据记录,以实现最高效和最有效的筛查PDF的解决方案.“大多数离群值检测机制本质上是统计的,因此离群值筛选是在电流和电压不再相关的统计单元中进行的统计测试。最佳实践是根据考虑的每个测量的标准偏差对每个测量进行数据记录。然后,您可以正确地分析跨多个晶圆和批次的异常值限制的可变性。在我之前走过这条路的人已经指出了这一最佳实践。具体来说,我在几年前的SEMI CAST会议上从Jeff Roehr那里学到了这种数据记录统计测试的开明方法。”

IEEE高级成员Roehr进一步阐述。“很明显,如果每个晶圆被作为单个实体(批次)处理,并为每个数据值计算RSD(剩余标准偏差)值,那么多个晶圆(批次)可以使用RSD尺度组合,并且NNR(最近邻残差)方法可以用于发现双变量异常值,即使是在多个批次的大群体中。基本上,将所有数据从测量值转换为RSD变化,然后仅使用RSD值进行所有离群值数据分析。”


图2:使用剩余标准偏差的两个测试之间的相关性。来源:Jeff Roehr

仔细辨别及格和不及格
基于统计的测试限制,无论是一个、两个还是多个测试参数,都应该仅在满足性能限制之后应用。仅仅关注统计上派生的极限会导致测试逃避。

“最明显的例子是,可接受的PAT分布在性能规格限制之内和之外,”Onto的McIntyre说。“工程师之所以选择将这些部件包括在内,是因为它们处于PAT分布‘限制’之内,尽管有些分布超出了定义的性能控制限制。”

因此,对于参数测试百分比较高的模拟和混合信号部件,测试程序维护数据表极限测试,然后应用离群值极限。

另一个确定通过与失败的角度可以通过片上监视器的镜头来观察,也称为芯片遥测电路。对于大型soc,这种内部数据可以有效地用于分离合格部件和失效部件。

proteanTec的Burlak说:“通过模具参数数据,可以在个性化的基础上检测异常值,而不是基于人群。“芯片遥测技术可以在早期构建高级估计器,允许在测量中添加另一个维度。现在,测试工程师可以检测出似乎在PAT范围内的异常值,而不会损失良好的产量,甚至可以收回潜在的损失产量。由于它是基于精度的,我们消除了假阳性和假阴性异常值,这是可以验证的。其中一种方法是运行包含检测到的异常值与正常总体的HTOL批次。我们的预期是,包含异常值的组将以相对于基线更高的百分比失败。”

通过数据分析平台减轻负担
工程师们在20年前开始使用二元离群值检测技术。Roehr说:“大约在2005年,异常值的概念就已经出现了。“但当时还没有商业软件和方法。当时任何使用异常值检测方法的人都在编写自己的代码。你必须自己发明。这些数据分析公司并不存在。今天,如果你想这样做,这些软件和工具现在已经可以在市场上买到。你可以用它们来扭转局面,至少一夜之间就能完成入门级的解决方案。”

在入门级解决方案之后,工程师需要数据分析能力来细化算法参数并验证这些参数的影响。

“通过分析,它可以查看历史数据,发现问题,并试图理解它们,”英特尔公司硅生命周期分析小组主管保罗·西蒙(Paul Simon)说Synopsys对此.然后实现算法来提高产品质量、产量或测试时间。当你实现一个离群值算法时,它有一定数量的参数。你希望算法的部署方式不会损失太多的产量,因为这是在质量上的权衡,这是产品工程师需要决定的。根据产品的不同,他们是否准备好牺牲10%的产量来获得一点点质量,或者相反?所以这需要在历史数据上模拟非常复杂的算法,然后调整这些算法。然后,你就可以在测试平台上部署调整后的算法。”

结论
客户退货经常促使工程团队考虑双变量测试极限。这些零件通过了所有单独的参数测试极限。在成对探索相关关系的测试数据值时,工程师通常会找到一个有效的鉴别器来检测它们。以这种方式辨别合格/不合格有利于质量和产量。

通过使用衍生的统计值来代替原始测试值,工程师能够更好地对正常过程变化的测试通过/限制进行鲁棒性测试。随着晶体管特性和金属线宽度的缩小,这一数字显著增加。

20年前,工程团队编写自定义代码来应用这些方法,包括数据分析和测试程序应用。随着数据分析平台的出现,工程团队将重点放在探索可能的测试组合和分析新的及格/不及格限制上。最后,有时两个测试值比一个更好。

有关的故事

自适应测试取得进展

自动集成电路的部分平均测试不够好

地理空间离群点检测

在IC制造中追逐测试逃脱



留下回复


(注:此名称将公开显示)

Baidu