中文 英语

人工智能、芯片和面具的下一步是什么

深度学习和新技术对未来节点扩展的影响。

受欢迎程度

藤村明(Aki Fujimura)表示d2他接受了《半导体工程》杂志的采访,讨论了人工智能和摩尔定律、光刻和掩模技术。以下是那次谈话的节选。

SE:在eBeam Initiative最近的照明调查中,参与者对掩模市场的前景有一些有趣的观察。这些观察结果是什么?

》:在过去的几年里,口罩的收入一直在上升。在此之前,口罩收入稳定在每年30亿美元左右。最近,它们已经超过了40亿美元的水平,而且预计还会继续上升。杰出人士认为,这一增长的一个组成部分是由于行业转向EUV.调查中的一个问题问参与者,“新冠疫情将对美国的商业产生什么影响?光掩模市场?“有些人认为这可能是负面的,但大多数人认为这不会有太大的影响,或者可能会有积极的影响。”在最近eBeam倡议小组成员评论说,乐观前景的原因可能是因为半导体行业的需求状况。居家隔离和在家工作的环境正在为电子和半导体行业创造更多的需求和机会。

SE:极紫外(EUV)光刻技术将如何影响掩模收入?

》:总体而言,三分之二的受访者认为这会产生积极影响。当你使用EUV时,掩模的数量会减少。这是因为EUV将行业带回了单一模式。193nm浸没与多模式需要更多掩模在高级节点。对于EUV,你有更少的掩模,但每个EUV层的掩模成本更贵。

SE:几十年来,集成电路行业一直遵循摩尔定律,即芯片中的晶体管密度每18至24个月翻一番。按照这种节奏,芯片制造商可以在一个芯片上封装更多更小的晶体管,但摩尔定律似乎正在放缓。接下来会发生什么?

》:的定义摩尔定律正在发生变化。它不再关注CPU时钟速度的趋势。这并没有太大改变。它更多地是按位宽而不是时钟速度缩放。这很大程度上与热性质和其他因素有关。随着时间的推移,我们有一些理论可以让它变得更好。另一方面,如果你看看使用gpu的大规模并行计算,或者有更多的CPU内核,以及你访问内存的速度有多快——或者你可以访问多少内存——如果你包括这些东西,摩尔定律是非常有效的。例如,D2S为半导体制造业提供计算系统,所以我们也是技术的消费者。我们做的是重型超级计算,所以了解在计算能力方面发生了什么对我们来说很重要。我们所看到的是,我们的计算能力正在以与以前相同的速度继续提高。 But as programmers we have to adapt how we take advantage of it. It’s not like you can take the same code and it automatically scales like it did 20 years ago. You have to understand how that scaling is different at any given point in time. You have to figure out how you can take advantage of the strength of the new generation of technology and then shift your code. So it’s definitely harder.

SE:逻辑路线图发生了什么?

》:就人们现在开始做的事情而言,我们已经达到了5纳米。他们开始计划3nm和2nm工艺。在到达2nm节点方面,人们都很舒服。问题是在此之后会发生什么。就在不久前,人们还在说:‘我们不可能实现2nm制程。这是半导体行业的普遍模式。这个行业正在不断地自我改造。它把事情延长得比人们想象的要长。例如,看看193nm光刻技术在高级节点上持续了多长时间。曾几何时,人们都在等待EUV。曾经有很多关于EUV的悲观论调。 But despite being late, companies developed new processes and patterning schemes to extend 193nm. It takes coordination by a lot of people to make this happen.

SE:我们目前的技术可以扩展多久?

》:毫无疑问,身体是有极限的,但我们在接下来的10年里还是不错的。

SE:围绕人工智能和机器学习有很多活动。你认为深度学习适合在哪里?

》:深度学习的子集机器学习.正是这个子集使得机器学习具有革命性。深度学习的一般思想是模仿大脑如何利用神经元或节点网络工作。程序员首先决定使用哪种网络。然后程序员用一大堆数据来训练网络。通常,网络是由标记数据训练的。以缺陷分类为例,一个人或其他一些程序将每张图片标记为缺陷或不是缺陷,还可能标记它是什么类型的缺陷,甚至应该如何修复。深度学习引擎迭代优化网络中的权重。它会自动找到一组权重,这将导致网络最好地模拟标签。然后,网络尝试使用它没有训练过的数据来测试网络是否按照预期学习。

SE:深度学习不能做什么?

》:深度学习不推理。深度学习进行模式匹配。令人惊讶的是,事实证明,世界上的许多问题完全可以通过模式匹配来解决。你可以用深度学习做一些常规编程做不到的事情。上世纪80年代初,我是一名学习人工智能的学生。当时(以及从那以后)世界上许多最优秀的计算机科学家已经在努力创建一个可以击败国际象棋大师的国际象棋程序。在深度学习出现之前,这是不可能的。应用于半导体制造或任何领域,如果没有深度学习,有一些问题实际上是不可能解决的。

SE:几年前,没有足够的计算能力让机器学习变得可行。改变了什么?

》:第一份出版物描述了卷积神经网络是在1975年。研究人员福岛邦彦(Kunihiko Fukushima)博士当时将其称为“新认知”(neocognitron),但这篇论文主要描述的是深度学习。但是计算能力是不够的。深度学习是通过低成本的gpu在大规模计算中实现的,我称之为“有用的浪费”。

SE:深度学习可以解决哪些问题?

》:深度学习可以用于任何数据。例如,人们使用它进行文本到语音、语音到文本或自动翻译。如今深度学习发展得最快的地方是我们谈论二维数据和图像处理的时候。GPU因其单指令多数据(SIMD)处理特性而成为深度学习的良好平台。SIMD体系结构还擅长图像处理,因此以这种方式应用它是有意义的。因此,对于任何一个人类专家可以在没有任何其他背景知识的情况下看一张图片,并以高概率说出一些东西的问题,深度学习很可能能够做得很好。

SE:机器学习在半导体制造业中如何?

》:我们已经开始看到在软件和设备中结合深度学习的产品。任何人工操作人员需要执行的繁琐且容易出错的过程,特别是那些涉及视觉检查的过程,都是深度学习的理想选择。有许多机会检查而且计量.在软件方面也有很多机会可以更快地产生更准确的结果,以帮助解决领先的掩模车间的周转时间问题。将口罩车间和机器日志文件中的大数据与机器学习相关联,以进行预测性维护,有很多机会。

SE:挑战是什么?

》:深度学习的效果取决于所提供的数据,因此在部署深度学习时需要谨慎。例如,如果深度学习通过学习以前招聘实践提供的标签来筛选简历,那么深度学习就会学习过去实践中已经存在的偏见,即使是无意的。如果操作员倾向于在分类图像时犯某种类型的错误,那么从操作员过去行为标记的数据中学习的深度学习将会学习犯同样的错误。如果利用深度学习,根据过去的逮捕历史,在街道上的摄像头捕捉到的街道图像中识别可疑的犯罪行为,深度学习将尽可能地模仿过去的行为。如果深度学习被用来识别社交媒体用户倾向于想要看到什么,以实现广告收入最大化,那么深度学习将学会非常擅长向用户展示用户倾向于观看的内容,即使这些内容带有高度偏见、虚假或不恰当。如果使用不当,深度学习可能会加剧和加速人类的上瘾和偏见。深度学习是一种强大的武器,它依赖于使用它的人类仔细使用它。

SE:在执行模式识别任务时,机器学习是否比人类更准确?

》:在许多情况下,人们发现基于深度学习的程序可以比人类更好地推断,准确率更高,特别是当你随着时间的推移观察它时。一个人可能能够以99%的准确率看到一张图片并识别它。但如果同一个人要看一个更大的数据集,一年200天,每天8小时,这个人的表现就会下降。但对于包括深度学习在内的基于计算机的算法来说,情况并非如此。学习算法处理大量的数据。他们一次只学习一小部分内容,不会漏掉任何内容。当你考虑到这一点时,深度学习程序对于这些容易出错的过程是有用的,这些过程是面向视觉的,或者可以转换为面向视觉的。

SE:业界正在研究其他技术来复制大脑的功能。神经形态计算就是一个例子。这有多现实?

》:大脑很神奇。要建立实际大脑的神经网络需要很长时间。未来会有非常有趣的计算模型。神经形态并不是一个不同的计算模型。这是一种不同的做事方式。不清楚是否神经形态计算必然会创造出新的能力。这确实使其中一些更有效率和有效。

SE:量子计算呢?

》:最大的变化是量子计算.这需要大量的技术、资金和人才。这不是一项容易开发的技术。但你可以打赌,领先的技术国家正在研究它,在我看来,毫无疑问,它很重要。以安全为例。256位加密在基本的量子计算中根本不算什么。在量子计算领域,安全机制必须进行重大改进。量子计算的错误使用可能是毁灭性的。保持领先关系到国家安全。但量子计算在解决被认为难以解决的问题方面也非常强大。 Many iterative optimization problems, including deep learning training, will see major discontinuities with quantum computing.

SE:让我们回到掩模行业。几年前,面具很简单。随着时间的推移,面具变得越来越复杂,对吧?

》:在130nm左右,你开始看到掩模上的装饰。如果您想在晶圆上使用曼哈顿形状或直线形状画一个圆,您实际上在掩模上画了一个正方形。最终,它会在晶圆上变成一个圆。然而,从130纳米左右开始,掩模上的正方形必须在所有四个角上都写有装饰。然后,sraf(子分辨率辅助功能)开始出现在掩模上约90nm。可能有一些是130纳米的,但大多数是90纳米的。到22nm时,你无法找到一个没有sraf的关键层掩模。sraf是掩模上的特征,明确设计为不打印在晶圆上。通过一个角度,sraf将光投射到你想要打印在晶圆上的主要特征上——足够多,从而有助于增加应用在抗蚀剂上的能量。同样,这使得打印的主要特征更能适应制造工艺的变化。

SE:然后在16nm/14nm左右出现了多种模式,对吗?

》:特征尺寸变得更小,更复杂。当我们达到193i的分辨率极限时,我们别无选择,只能采用多模制,即在一个晶圆层上打印多个掩模。你把你想要的特征划分在一个给定的晶圆层上,然后把它们放在不同的掩模上。这为每个面罩的sraf提供了更多的空间。一些层的EUV也被投射到多个图案。多模制的成本更高,但它是一种熟悉的、经过验证的技术,可以将光刻扩展到更小的节点。

SE:为了制作掩模,掩模制造商使用基于可变形状光束(VSB)技术的电子束掩模写入系统。现在,使用数千个微小光束的多波束掩模编写器已经上市。你如何看待这一趋势?

》:大多数半导体器件的关键层都使用VSB写入器。这很好。写入时间在增加。如果你看一下eBeam Initiative最近的调查,平均写时间仍然在8小时左右。展望未来,我们正朝着更复杂的EUV掩模工艺迈进。如今,EUV掩模相当简单。矩形书写就足够了。但你需要多波束掩模写入器,因为抵抗灵敏度。电阻是缓慢的,以便更准确。我们需要应用大量的能量来使其工作,这对于多波束掩模写入器来说更好。

SE: EUV掩模的下一步是什么?

》:EUV掩模也需要sraf。现在的7nm工艺没有。sraf对于较小的特性是必要的。而且,对于193i以及EUV,曲线掩模现在正在考虑改善晶圆质量,特别是对制造变化的弹性。但对于EUV,由于反射光学,曲线sraf更需要。由于多波束掩模写入可以在没有写入时间损失的情况下实现曲线掩模形状,因此在相同掩模写入时间内增强的晶圆质量是很有吸引力的。

SE:未来口罩面临的最大挑战是什么?

》:还有很多。EUV薄膜价格实惠的无缺陷EUV掩模坯料,高NA EUV,以及光化或电子束掩模检测-无论是在掩模车间还是在晶圆车间进行再认证-都是重要的发展领域。现在,采用曲线掩模形状的必要性已得到广泛认可。数据处理,包括快速读写的紧凑无损数据表示,是一个重要的挑战。光学接近校正(OPC)和反向光刻技术(ILT),需要生产这些曲线掩模形状,以最大化晶圆性能,需要运行得足够快,以实现实用性。

SE:在口罩上设计曲线形状的挑战是什么?

》:有两个问题。如果没有多波束掩模写入器,生产具有曲线形状的掩模可能太昂贵或实际上可能需要太长时间写入。其次,控制口罩的变化具有挑战性。再一次,你想要曲线形状的掩模的原因是晶圆质量大大提高。这对于EUV来说比193nm浸没式光刻更为重要。EUV掩模具有反射性。因此,EUV掩模上也有一个6度的入射角。这使得人们更想拥有曲线形状或sraf。它们不在威化片上打印。它们被打印在掩模上,以帮助减少晶圆上的工艺变化。

SE:那么ILT呢?

》:ILT是OPC的一种高级形式,它计算所需的掩模形状,以最大限度地提高晶圆光刻质量。研究表明,ILT -特别是无约束曲线ILT -可以在对制造变化的弹性方面产生最好的结果。D2S和美光(Micron)最近发表了一篇关于全芯片、曲线无针ILT与掩膜-晶圆协同优化的内存应用的好处的论文。这种方法使进程窗口提高了2倍以上。

SE: AI会在面具制作中扮演重要角色吗?

》:是的。特别是,对于深度学习,有前途的原型和生产级推理引擎之间的差距是非常大的。虽然最初人们对深度学习非常兴奋,但世界上仍然没有看到深度学习在生产中的广泛应用。这在很大程度上来自于对数据的需求。在半导体制造业中,数据安全是极其重要的。因此,虽然给定的制造商拥有大量自己的数据,但任何给定工具(无论是软件还是设备)的供应商都很难获得足够的客户数据。即使对制造商来说,创建新的数据——比如缺陷的扫描电镜图片——也可能是困难和耗时的。然而,深度学习编程是用数据编程,而不是写新代码。如果一名深度学习程序员想要将推理引擎的成功率从92%提高到95%,那么他就需要分析引擎,看看需要额外训练哪些类型的数据来进行改进,然后获取该类型数据的许多实例,然后进行迭代。唯一能够高效和有效地做到这一点的方法是拥有数字双胞胎,这是一个生成数据的模拟环境,而不是仅仅依赖于物理真实的样本数据。 Getting to 80% success rate can be done with thousands of collected real data. But getting to 95% success rate requires digital twins. It is the lack of this understanding that is preventing production deployment of deep learning in many potential areas. It is clear to me that many of the tedious and error-prone processes can benefit from deep learning. And it is also clear to me that acceleration of many computing tasks using deep learning will benefit the deployment of new software capabilities in the mask shop.

有关的故事

EUV在3nm及以下的不确定未来

EUV面临的挑战依然存在

成熟节点的掩模/光刻问题

数字双胞胎的进化

新一代面具作家竞赛开始



留下回复


(注:此名称将公开显示)

Baidu