中文 英语

AI在芯片制造中的应用

covenor的CTO深入研究了预测性维护,变化的影响,以及这对产量和未来技术的意义。

受欢迎程度

Lam Research公司Coventor的CTO David Fried接受了《半导体工程》杂志的采访,讨论了人工智能和大数据技术将如何用于提高芯片制造的良率和质量。以下是那次谈话的节选。

SE:我们曾经从异常值的角度来考虑制造业数据,但随着每个新节点的公差变得更紧,数据可能需要检查,甚至在被认为是正常的范围内。这对制造业有什么影响?

:当我开始在200mm的CMOS工作时,在晶圆厂的工具上有一些数据,但总的来说,它一被创建,我们就丢失了它。当我们达到300mm时,我们可以更好地在工具上安装传感器,生成数据,在某些情况下还可以查看数据。

SE:所以你有大量的数据,如果没有必要的话,没有人真的想要查看这些数据,对吗?

:是的,我们已经发展到这样的地步:如果(加工过的)批次从工厂出来,但它们不能工作,你就会回去做标准的定性操作,并确定是否是“工艺26”导致了这个故障。你发现工序26上的工艺阀奇怪地不在你在那个工具上加工的其他批次的位置,所以这可能是节流阀的问题。然后你对节流阀信号进行故障检测,以防止这种情况再次发生。但这是一个非常被动的数据流。你已经失败了,然后你走出去寻找原因。但如果你想想我们在创新和个人流程本身的复杂程度,这种反应性数据流将永远无法跟上。

SE:那你接下来要去哪里?

:该设备具有传感器,用于分析来自工具操作和晶圆过程监控的数据。例如,传感器和数据日志正在收集有关哪个晶圆进入哪个腔室的信息,机械臂在任何时间点的位置等等。所有这些数据都必须进入一个系统,在那里可以实时收集和分析。这还只是一件设备的数据。在晶圆厂,你有很多这样的设备,然后你有各种各样的其他设备和不同的工艺。这是一个巨大的大数据挑战,你真正想要开始做的是在这些数据上学习。

SE:所以你是在试图描绘变化的趋势,而不是解决一个单一的问题,对吗?

:是的,还有预测能力。但你必须为所有人做这件事。

SE:在制造过程中,你要走多远才能意识到过程一开始就存在问题?

这就是这个问题所涉及的技巧。您正在集成额外的数据。我们可以收集每一个工具的每一个零件,但是你还想把它与每一个内联计量,内联缺陷检查分类,内联电气测试,一直到完整的功能测试集成在一起。你有这么多不同的数据源。第一类问题是大数据问题——将所有数据转换成可用的结构和格式,因为我们正在处理来自大量不同格式的来源的大量数据。解决格式问题听起来并不难,但想想沉积工具中的温度传感器与泥浆槽中的泥浆pH监控器,为CMP工具提供泥浆。这是一种不同类型的数据用不同的方式采样使用不同的单元集。只是把它转换成一种可以对数据集进行操作的格式就是一个巨大的大数据问题。让我们假设所有数据都是可收集和可访问的。然后你就可以开始基本的实时机器学习,主动地将电气测试数据和计量数据耦合起来。 Trends and patterns start emerging, and algorithms can be put in place to guard against or compensate for deviation.

SE:那么实际上应用机器学习来改善制造过程?

:是的。趋势正在出现,你可以根据这些趋势制定相应的算法。从机器学习到真正的人工智能是一个大趋势。假设我们可以解决这个大数据挑战,真正令人兴奋的未来是从简单的机器学习,这已经存在了,到更大、更广泛、完全集成的数据集,并深入到人工智能中,你可以从产量、吞吐量、设备性能的角度了解这条生产线的目标,你可以学习所有正确的信号来调整整个路径。

SE:这是关于在之前的基础上对整个过程进行微调,对吗?但你不能一五一四地做。每件作品都必须有背景。

:你可以通过查看数据块来微调,这有内在的价值。如果没有这样的工作,我们不可能达到7nm。除此之外,还有两个挑战。一个是把数据碎片放在一起。人们忽略了它的这一方面,但它非常复杂。在组装所有这些数据时,有一些非常严重的大数据挑战。然后,学习、算法和通过这些数据进行优化的计算部分,这就是人工智能开始驱动的地方。

SE:你正在处理的数据是始终如一的,还是不同格式的临时片段?

这要看情况。你看看工厂里的某些设备,它可能会保留7天的数据。有一些数据传到主机上,然后主机决定它想要存储多长时间。有一些数据会保留在工具上,工具可以决定它需要保留这些数据多长时间。你需要优先考虑某些数据。您可能会保留一些数据30天,一些数据7天,还有一些您想在处理后立即删除。否则,每台设备都有数据仓库。但如果你真的想在这方面做得更好,也许我们需要更长时间地保存一些数据,并以不同的方式进行存储。

SE:变奏是如何融入其中的?它会改变数据吗?

这个问题有两个方面。变化既是数据来源,也是数据影响。你在计量的过程中发现了变化。但当这种变化影响到下一个工具时,可能会导致传感器记录数据的方式不同,或实际过程发生变化。如果我把一个硅片放入一个工具中,并运行一个过程,我将得到不同的读数。如果我把不同类型的晶圆放入这个工具中,我可能会得到不同的传感器读数。问题是传入的、固有的、完全处理的晶圆差异是否会导致不同的传感器数据。随着传感器变得越来越先进,处理这些晶圆的信号也变得越来越先进,变化将会控制你得到的数据的性质。

SE:这完全改变了我们通过制造来思考芯片设计的方式。

:我们曾经考虑设计的标称和包含变化围绕它。你瞄准靶心射击。你围绕着它设计一切。你在你的设计规范和你的工厂里建立了足够的裕度,来包含预期的变化。考虑到复杂性,事实上,现在的变化是在名义维度的规模上,你不能再这样想了。没有人能射中靶心。我们在几年前做的一些建模工作中发现,你必须从可装运货物的总允许窗口来设计你的技术、你的集成、你的流程流和流程能力。如果您为窗口设计流程,则不会关心靶心在哪里。真正酷的部分是,如果你为窗口设计,你可以得到一个很好的屈服过程或流程,中间的标称目标不需要看起来很好。

SE:我们在很多设计中都看到了这一点,因为最终设计的外观与所有人的预期不同。

这是一种违反直觉的完美表现。如果我正确地设计了窗口,我不关心中心点是什么。如果我找到所有可能的变化,我就可以开始收紧。但名义已经不再重要。

SE:当我们深入到最先进的节点时,我们开始遇到过去不需要考虑的噪声。部分原因是电介质,设备之间的距离,电子不能被包含。

每一代人都是这样。每一代都有新的物理现象、新的机制、新的数据和我们从未想过需要担心的新问题。我们从来不用担心门漏或聚损耗。但我们到了我们需要的地步,我们了解了它的影响,我们把它建立在预测模型中,我们围绕这项技术建立了一个行业。这没有什么不同。

SE:这是十多年来我们第一次听到内存瓶颈的说法。几十年来,人们第一次重新审视基本款。

:这又回到了工作量上。有一些更新和新颖的工作负载对内存有无法满足的需求。这些都是非常具体的应用。有一些应用程序仍然在推动单线程CPU性能,还有一些应用程序在推动GPU核心并行化。根据是云还是物联网,您将为该工作负载选择不同的配置。人工智能、机器学习、大数据是驱动大量数据在内存和处理器之间来回传输的应用程序。我们在内存密度、每比特成本和内存扩展方面取得了巨大的进步。但是现在我们需要一个管道来输入和输出数据。对内存和内存技术的需求超过了基础设施。

SE:另一个问题是,人们不能把所有这些数据都发送到云端,因为生成的数据太多了。

:还有架构上的决策。当你想到物联网时,如果你要在城市的每个区域放置数百个传感器,你将获得大量的数据。如果一个人抢了银行,而你要跟踪他,一种方法是把所有的高清视频从成千上万的交通信号摄像头中抽取到某个远程数据中心,然后你开始尽可能地处理这些数据。这是一种非常低效的资源配置。但如果你在每一个摄像头中加入一些低级的计算能力,你就可以说,‘他向右转了,看看那边一个街区的摄像头。“所以你把大量的计算能力放在网络的边缘,现在你有了一个更高效的系统架构。

SE:这就是最大的变化,对吧?这是系统架构,所以设计不再是孤立的。它们是在环境中完成的,但会考虑到它们将如何随着时间的推移而发展。

对于在城市中追踪银行抢劫犯的概念,决策能力和计算能力的高低是非常重要的。

SE:五年前,这只是科幻小说。

:是的,现在我们正在做出详细的决定,比如最佳的总线结构,以实际实现这些事情。这已经不是科幻小说了。

有关的故事
晶圆厂遇到机器学习
深度学习、EUV和其他制造业进步的影响。
利用数据提高产量和可靠性
作为改进测试和制造方法的一种方法,异常值检测越来越受到重视。
利用数据提高产量
信息技术大大提高了工业生产的效率。



留下回复


(注:此名称将公开显示)

Baidu