中文 英语

太多的晶圆厂和测试数据,低利用率

目前,收集到的数据的增长已经超过了工程师分析所有数据的能力。

受欢迎程度

在半导体和电子制造过程中会有数据过多的情况吗?答案是,视情况而定。

据估计,从设计到制造再到现场,半导体供应链上收集的数据中有80%或更多从未被查看过。虽然这可能令人惊讶,但有一些很好的理由:

  • 工程师只关注解决特定问题所需的数据,而不是收集到的所有数据。这与“短途旅行”特别相关,因为工程师希望快速查明问题的原因并解决它。
  • 一旦半导体工艺稳定,或者产品成熟,就没有必要审查所有的数据。
  • 由军事和汽车公司推动的合同义务要求将数据存档10至15年,其中大部分数据永远不会再被触及。

还有一些不太好的理由可以解释为什么会忽略大量数据。其中一些是脏的,一些缺乏可追溯性和上下文,并且可能存在关于数据源来源的问题。最重要的是,有太多的数据需要消化。芯片世界正被淹没在其中,而且数量还在继续膨胀。

“大约90%的可用数据是不到2年的,这意味着突然出现了大量数据,它们突然出现——有人可能会说一夜之间,”facebook技术和战略副总裁基思·绍布(Keith Schaub)说美国效果显著。“数据传输、存储和访问都必须改变,以应对不断扩大的大规模数据海啸。”

半导体制造IT专业人士正在见证所有产品部门的数据突然爆炸。该行业正在努力解决这些数据的管理问题,同时也在努力收集更多的数据,因为这些数据可能很有用。考虑到过去只以抽样为基础的检验和计量步骤已经转移到100%抽样。

“如果你只是采样,你只能在帕累托图的第一或第二条柱状图上操作,你无法了解你的失败率,”Instrumental的首席执行官Anna-Katrina Shedletsky说。“我坚信,如果你不去衡量它,你就无法改变它。所以如果你不测量它,那就意味着你不关心那个特定的项目。”

拥有大量的数据——无论是广度还是深度——确实使工程师能够进行更复杂的统计分析,这反过来又可以用来解开不寻常的测试信号,并平衡质量、产量和成本。高通公司工程高级副总裁迈克·坎贝尔(Mike Campbell)在2019年国际测试大会(International Test Conference)上发表主题演讲时指出,应用先进的数据分析方法减少了公司的虚拟计量误差,并将测量精度提高了10倍以上。

但是,收集、存储和连接这些数据变得非常重要,因为需要分析的数据是pb级的。

微软软件产品管理总监迈克•麦金太尔(Mike McIntyre)表示:“如今,拥有自动化/智能技术来筛选这些tb级的数据以获取信号,既是一件好事,也是一件坏事。上的创新。“想想10到15年前,工程师在解决问题时必须处理十几个可能的信号,其中大多数信号都是他们自己产生的。今天,有成千上万的信号需要评估其重要性和贡献,这些信号不需要人类参与产生,最终应该由工程师来评估。”

由于业务孤岛、糟糕的数据治理以及不知道什么是有价值的,半导体行业的数据生态系统充满了碎片化的数据,这使得这一点变得更加困难。

“在某些情况下,我们并不真正了解哪些数据是有价值的。所以我们收集一切,然后我们几乎不使用它,”Stacy Ajouri说,他是德州仪器的高级技术人员,也是RITdb特别工作组的联合主席。“这是一个真正的挑战,因为它太多了。能够理解我们应该保留什么的部分问题在于我们没有数据的可追溯性。”

在理解数据的价值时,可追溯性是至关重要的。“拥有可追溯性是很重要的,这样你就能确切地知道你的故障部件来自哪里,”公司业务发展经理安德烈•范•德•盖因(Andre van de Geijn)表示yieldHUB。“你希望能够将它们映射到晶圆中。然后,您可以在特定测试值上关联设备,这可以提供有关设备和最终产品行为的见解。”

仍然有大量的数据需要管理,移动、清理、构建和存储这些数据都是有成本的。对于脏数据或未连接的数据,工程师能做的只有这么多。

深度和广度
那么这些数据的爆炸式增长从何而来呢?

答案很复杂。首先,到处都有更多的芯片,而且每个芯片都有自己复杂的历史。集成电路是我们日常生活中使用的许多产品的引擎。它们驱动着物联网和边缘网络,为我们的工厂和城市供电,它们控制着我们的建筑和智能手机的能源使用。

但仅凭这一点并不能解释制造业和测试数据的爆炸式增长。大型数字模具自然会产生更多的测试数据,但测试压缩技术在20多年前就发展起来了,以解决这个问题。这只是问题的一小部分。还有其他的来源。

从世纪之交开始,芯片制造商开始要求制造设备公司提供更多数据。二十年后,这些设备中包含的传感器数量显著增加,而且几乎到处都在添加传感器。这些传感器产生大量的数据,这反过来又导致了数据的泛滥,以及随后的数据存储和检索问题。

以工厂设备传感器跟踪数据为例。“对于光刻工具,它的采样频率高达50 KHz,”该公司晶圆厂应用高级总监Jon Holt说PDF的解决方案。“假设典型的10Hz采样率,当您考虑24x7操作时,数据会迅速增加,平均每个季度有500个工具用于100K晶圆。一旦达到pb量级,存储和管理就变得非常昂贵。”

图1:300mm晶圆厂在一分钟内产生的数据。来源:PDF解决方案

图1:300mm晶圆厂在一分钟内产生的数据。来源:PDF解决方案

晶圆检查为数据池提供了大量数据。为了实现零逃逸指标,晶圆厂已经开始对几个高风险可靠性和影响层增加100%晶圆扫描检查,目标是识别可能影响客户系统的异常晶圆/晶圆。

“如果你对晶圆进行分采样,就没有办法将现场可靠性问题追溯到制造步骤,因为很可能芯片从未经过任何形式的检查工具,”技术营销首席科学家Doug Sutherland说心理契约。“只有当你有这些筛选步骤,你检查100%的晶圆和100%的芯片,你才能防止泄漏。你需要能够将故障追溯到晶圆厂存在的实际问题。”

通过更快的扫描技术实现100%的检测,也可以存储更多的图像。这些图像可用于分析问题,并与其他类型的数据(如电气测试数据)交叉相关。

在测试方面,高通公司的坎贝尔表示,2019年每天大约产生2TB的数据。从那以后,这个数字一直在增加。在从10nm到7nm的移动过程中,测试数据量会跳跃,并且在每个新节点上都会再次增加。这在一定程度上是由于每个晶圆上有更多的芯片,但也是由于每个芯片上有更多的晶体管,设计复杂性增加,更多的工艺拐角,以及新的工艺、测试、诊断和更复杂的组装。

图2:随时间的累积数据量。来源:高通/ITC 2019年的报告

图2:随时间的累积数据量。来源:高通/ITC 2019年的报告

甚至测试的浮点数部分也生成了更多的数据。

银河半导体首席执行官韦斯·史密斯表示:“数据的数量和复杂性呈指数级增长。“我们最近创建了一个简单的图表,显示了我们数据量最大的客户的数据量,我们看到了相当一致的指数增长线,其中数据量大约每18到24个月增长一个数量级。”

其他国家的数据也出现了类似的跃升。GlobalFoundries的软件应用经理David Partyka说:“当我在2012年开始测试时,每片晶圆测试结果的文件大小为数百兆字节。”“现在,对于某些客户来说,每个晶圆的文件大小为15到16gb,这使得每个晶圆批次(25个晶圆)的数据量接近四分之一tb。数据量是巨大的,尤其是对于全新的产品。”

测试数据量的快速增长部分源于需要将工程数据与生产数据结合起来以提高产量。例如,GlobalFoundries从仅在工程车间收集深度、大批量的特性数据,转向将这些数据整合到初始晶圆的生产流程和生产过程中。随着时间的推移,这是分阶段发生的。

“我不知道具体日期,”GlobalFoundries Fab 8-Test DMTS主管约翰·卡鲁里(John Carulli)说。“我只能告诉你为什么——因为这么做太重要了。”

掌握良率学习的数据非常重要,在22nm、预finFET设计和14nm finFET设计之间,需要的数据量急剧增加。根据一位业内人士的说法,这需要将工程特性测试程序转移到生产测试环境中。在生产测试环境中使用的第一次失败就停止,限制了工程团队为提高产量而学习的能力。相反,在生产车间维护一个工程表征程序,允许收集坏模具的数据,以了解模具的哪个部分是合格的,哪个部分是不合格的。

使用所有这些数据的挑战
但是,每天都有千兆字节的数据,即使有更多的自动化分析,工程师也不可能筛选所有的数据。

PDF solutions的Exensio解决方案主管Greg Prewitt说:“公司仍然没有分析他们收集的所有数据。”“高达85%的数据仍然是‘暗数据’,这些数据甚至从未用于分析,但无论如何都会被保存下来。”

希望这些工具将来能够筛选更多的数据,以发现有用的信息或趋势。GlobalFoundries应用智能解决方案高级总监Sunil Narayanan表示:“作为旅程的一部分,我们开始将大量分析数据和分析所需数据推送到云端。”“我们注意到,我们每天要推送大约3tb以上的数据。在每天3tb的数据中,我们似乎只使用了20%或更少的数据进行分析(仍处于项目的早期阶段)。在接下来的一到两年里,当我们有更多的工具时,它可能会增长。”

为了理解大型复杂的制造过程,如果没有上下文和可追溯性,就无法对数据进行分析。分析工具可以处理这样的数据结构,这些数据结构捕获制造元数据以解释收集数据的条件,以及它的谱系或制造设备指纹。

当然,说起来容易做起来难。对于纵向数据分析,需要勤奋地存储和纠正显著的元数据。今天,这需要共同努力,这有助于解释为什么只有20%的数据被查看。

“过去的情况是,人们只是解析数据,然后将其作为原始数据加载到数据库中,”硅谷生命周期管理分析主管保罗·西蒙(Paul Simon)说Synopsys对此。“这已经不够了,因为生产过程中的操作变化(如测试设备)会影响你的理解。当您进行分析时,您希望跟踪和理解这些变化,并将这些变化与收集到的数据联系起来。例如,要做从最终测试到晶圆排序随时间的相关性,就会发生这些操作更改。这是很难正确储存的东西。”

一般来说,工程师需要更多的数据,但如果由于数据中断或损坏而丢失或不正确,这对他们没有任何好处。

TI的Ajouri详细阐述了这些具体的挑战。“只是信息的质量是一个问题,即确保信息准确和完整的能力。使用这些旧格式的测试数据文件变得越来越大。此外,这些旧格式已经不能满足我们的所有需求了。”

解决数据质量问题还需要调整数据。工厂、装配和测试设备的标准可以帮助校准。“今天,我们有使用专有或临时数据格式的不兼容数据系统,”Advantest的Schaub说。“为了更好地协调这些系统,我们正在进行大量的集成工作,这也将大大提高数据的价值。”

安拓创新软件现场应用和客户支持经理Melvin Lee Wei Heng表示同意。“后端工具的标准数据格式目前仍然是一个挑战,即使在今天,许多新的工具供应商也没有结构化的数据导出。很多时候,必须编写自定义数据加载程序。在某些情况下,该工具甚至需要对软件进行更新,以便导出用于产量分析的正确内容。”

串连点点滴滴
尽管存在数据管理方面的挑战,但整个供应链中的半导体公司都看到了连接多个来源的数据以做出制造决策的机会。

其中一些需要在瞄准正确的数据时深思熟虑。片上电路在这个领域很有前途。

“随着数据的爆炸式增长,我们需要考虑用例,”苹果产品营销副总裁Shai Eisen说proteanTecs。“挑战在于找到与该用例相关的正确数据点,并找到这些数据点与其他不相关数据类型之间的相关性。当你设计数据来处理特定的用例时,那么数据就被设计成生成你需要的特定用例的信息。”

在设计复杂的IC器件时,需要预先考虑这些问题,而领域知识通常是必不可少的。在处理制造过程中产生的所有数据时,工程师需要保持在循环中,这对于实现智能制造/工业4.0的全部承诺尤为重要。基于统计的分析模型需要跨多个来源的大量数据来进行预测,并进行改进,以平衡生产测试的跷跷板产量质量。此外,纵向历史数据在辅助边缘决策以及协助工厂本地决策方面也有价值。

为了更容易地连接来自多个数据源的数据之间的点,还需要数据共享标准或/和分析平台。

PDF Solutions总裁兼首席执行官John Kibarian表示:“许多设备公司都希望在工具层面提供智能。“他们需要一个平台来处理所有这些数据。问题在于,这个行业并不需要每个人都使用自己的平台和自己的数据收集技术。”

但是,以一致和有意义的方式收集、排序和结构化数据有些混乱,部分原因是没有人考虑到大规模统计分析或机器学习(ML)在开始添加传感器时能够利用这些数据。

结论
如果今天只有10%到20%的收集数据被查看,那么行业需要认真处理为什么会出现这种情况。我们有正当理由不去查看所有收集到的数据,包括过去15年或更久的历史数据。

然而,芯片行业正处于机器学习识别pb级数据集模式细微变化的能力的边缘,仅仅拥有更多的数据并不一定是进步的标志。“有很多数据,但仅仅因为有很多数据并不意味着它是有价值的数据或具有正确的分辨率,”仪器公司的Shedletsky说。“坦率地说,我们认为确实存在数据过多的问题。”



5个评论

彼得·安德鲁斯 说:

谢谢安妮这篇非常煽动性的文章。由于新的或扩大的测试条件,我的客户通常需要具有更快测试吞吐量的设备,以便“跟上”不断增加的数据收集……似乎做机器学习趋势分析的公司,处理所有额外的数据,需要与测试公司并行发展。

安妮Meixner 说:

彼得,很高兴这篇文章与你的经历相符。
我对你关于数据分析公司需要并行发展的观察感到好奇。你能详细说明一下吗?

Manan Dedhia 说:

非常好的文章。我可以特别证明,汽车客户对更多的数据挖掘和更快的数据请求周转的需求正在不断增长。这确实突出了需要查看的数据库的碎片性——Fab、探针、组装、最终测试、模块测试等。但在每个子行业中,没有数据分析工具和经过专门培训的工程师是不可能的。

安妮Meixner 说:

Manan,

感谢你分享自己的经验。我喜欢你关于让工程师接受专门培训来使用数据分析工具的评论。这与Mike McIntrye所说的非常吻合。

Jnanadarshan Nayak 说:

难怪随着数据量的爆炸式增长,许多芯片制造商都将目光投向云存储和分析数据。现在是半导体制造商像其他行业一样认真看待云计算的时候了。

留言回复


(注:此名称将公开显示)

Baidu