中文 英语

提炼四个DAC主题演讲的精髓

共同的主题出现了,但从商业机会到对环境的关注,看待问题的不同方式也出现了。

受欢迎程度

芯片设计和验证正面临越来越多的挑战。如何解决这些问题——特别是机器学习的加入——是EDA行业的一个主要问题,这也是本月设计自动化会议上四位主旨发言人的共同主题。

DAC以现场活动的形式回归,今年的主题演讲涉及一家系统公司、一家EDA供应商、一家初创公司和一位大学教授的领导。

Mark Papermaster,首席技术官兼技术和工程执行副总裁AMD

AMD首席技术官兼技术和工程执行副总裁Mark Papermaster(图片来源:半导体工程/Jesse Allen

纸师傅以一个观察开始了他的谈话。“在技术和计算领域,从未有过如此激动人心的时刻。我们正面临一个巨大的拐点。我们在新的人工智能算法中看到的爆炸式数据量和更有效的分析技术的结合,意味着要让所有数据工作,就会产生对计算的永不满足的需求。在我40年的行业生涯中,我们有30年是依赖摩尔定律的。我可以指望每18个月就有一次显著的改进,降低设备的成本,提高每个流程节点的密度和性能。但是,随着该行业进入这些微小的平版印刷,制造的复杂性已经大大增加。显然,摩尔定律的速度已经放缓。成本随着每个节点的增加而增加。掩模的数量正在增加,虽然我们获得了密度的增加,但它们没有获得与我们以前相同的缩放因子或相同的性能改进。 There will be a metamorphosis of how we approach the next generation of devices.”

Papermaster指出,嵌入式设备正变得无处不在,而且它们正变得越来越智能。由人工智能驱动的计算需求在各地都在上升,这需要新的方法来加速改进。专家预测,到2025年,机器生成的数据量将超过人类生成的数据量。这促使我们改变了对计算的看法。这让我们思考将加速器以芯片或芯片的形式植入设备的新方法。作为一个行业,我们必须共同迎接挑战,这就是让我兴奋的蜕变。这就是我们克服挑战的方式。”

其中一个大问题涉及到十字线的限制,它决定了一块硅片上可以塞多少东西。Papermaster表示,这将导致更多的设计和更多的设计自动化,而这只能通过合作和伙伴关系来实现。解决方案将依赖于异构性以及如何处理复杂性。软件需要以“左移”的方式与硬件一起设计。“过去十年晶体管数量增加了225倍,这意味着我们现在的设计有1460亿个晶体管,我们必须部署芯片。”

图1:通过合作创造的生态系统。来源:AMD(基于Needham & Co.数据)

图1:通过合作创造的生态系统。来源:AMD(基于Needham & Co.数据)

然而,这并不是一个新想法。“如果我们回顾1964年的第一届DAC,它被创建为帮助避免冗余工作的社会(SHARE)。这个首字母缩写词很能说明我们现在需要什么。我们需要对我们正在解决的问题有一个共同的看法。”

简而言之,解决该行业目前面临的问题不可能由任何一家公司来完成,许多创新都发生在合作伙伴关系的重叠中。

图2:缩放收益的百分比。AMD来源

图2:缩放收益的百分比。AMD来源

在3nm工艺上,设计技术协同优化(DTCO)有望超越固有缩放技术。这些趋势对EDA、应用程序开发人员和设计界都是一个挑战。为了解决这些问题,解决方案平台需要重新架构,特别是针对人工智能。它将引擎和芯片连接在一起,通过软件堆栈层来创建平台。引擎变得越来越特定,而且越来越多的任务需要特定领域的加速器。

图3所示。解决问题的平台方法。来源:AMD

图3所示。解决问题的平台方法。来源:AMD

“在芯片的下一个时代,我们将看到2D和3D方法的多种组合,为了性能和功耗而进行的分区将开辟新的设计可能性。这将为EDA创造难以置信的机会,你将不得不重新思考过去的许多事情。我们还必须以可持续的方式来做这件事,并更多地考虑能源问题。IT计算正处于消耗所有可用能源的轨道上,我们现在必须限制它。”

Papermaster公司的董事长兼首席执行官Aart deGeusSynopsys对此,讨论计算的可持续性。

DeGeus专注于摩尔定律的指数,覆盖了CO的指数2排放。“这两条曲线几乎完全吻合,这一事实应该让我们所有人都感到非常恐惧,”他说。“我们的目标很明确。我们必须在这十年内将每瓦性能提高100倍。我们需要在能源生产、分配、储存、利用和优化方面取得突破。行动的号召——有头脑去理解的人应该有心去帮助。你应该有行动的勇气。我支持我们的赞助商地球发出的这一信息。”

Papermaster随后表示,AMD的电源效率目标是2025年的30倍,比行业目标高出2.5倍。他说,AMD正在步入正轨,目前已经实现了7倍的改善。“如果整个行业都能实现这一目标,10年内将节省510亿千瓦的能源,节省62亿美元的能源成本,并降低CO2排放量相当于6亿棵树苗。”

Papermaster补充说,人工智能正处于设计自动化行业的转型阶段。他说:“它几乎涉及到我们今天活动的方方面面。”他指出,仿真、数字双胞胎、生成式设计和设计优化等各种技术都是驱动EDA的用例。“我们正在使用人工智能来帮助提高结果的质量,探索设计空间并提高生产力。”

他还举例说明了包装的作用。通过在逻辑上叠加缓存,AMD可以实现66%的RTL模拟速度。

Anirudh Devgan,总裁兼首席执行官节奏

Anirudh Devgan, Cadence总裁兼首席执行官

Devgan的演讲题目是“计算软件和智能电子系统的未来”,他将其定义为计算机科学加上数学,并指出这是EDA的基础。

Devgan说:“EDA从60年代末到70年代初一直这样做。“计算软件已经应用到半导体领域,而且仍在蓬勃发展,但我相信它可以应用到很多其他领域,包括电子系统。过去10年是软件的大发展,尤其是在社交媒体领域,但在未来10到20年,即使是软件也将变得更具有计算性。”

半导体行业的增长有很多世代驱动因素。在过去,有一些单一的产品类别经历了繁荣和萧条。“一直以来的问题是,‘它会继续是周期性增长,还是会成为代际增长?’”德夫根说。“我相信,考虑到应用的数量,半导体的周期性将变得不那么强。”

他说,虽然设计成本在上升,但人们忘了考虑体积。“半导体的数量呈指数级增长,所以如果你将设计成本正常化,成本真的上升了吗?半导体必须提供更好的价值,这一点正在发生,并反映在过去几年的收入中。需要分析的数据量也在增加。这改变了计算机存储和网络模式。虽然领域特定计算是在90年代讨论的,但在最近几年它已经变得非常重要。这使我们更接近消费者和生产更多硅的系统公司。在数据的推动下,硬件、软件和机械之间的相互作用正在推动系统公司的复兴。45%的客户是我们认为的系统公司。”

图4所示。数据的影响力越来越大。来源:节奏。

图4所示。数据的影响力越来越大。来源:节奏。

Devgan指出了三个趋势。首先,系统公司正在制造硅。其次是3D-IC或基于芯片的设计的出现。第三,EDA可以利用人工智能提供更多的自动化。他为每个领域提供了一些支持信息,然后研究了各种应用领域以及模型如何应用于它们。他同意Papermaster的观点,后者认为收益不再仅仅来自规模,整合正在成为一件更大的事情。他还概述了计算软件在不同代EDA中出现的阶段。

图5:EDA软件的时代。来源:节奏

图5:EDA软件的时代。来源:节奏

也许这次讨论中最重要的事情是EDA必须开始解决整个堆栈,而不仅仅是硅。它必须包括系统和包。“机械和电气的融合需要不同的方法,传统的算法必须重写,”Devgan说。“热能则不同。几何形状是不同的。经典的EDA一直致力于提高生产力。基于物理的方法和数据驱动的方法的结合效果很好,但EDA在历史上只专注于单次运行。没有从一次运行到下一次运行的知识转移。我们需要一个框架和数学方法来优化多次运行,这就是数据驱动方法的有用之处。”

优化是他提供了一个例子的领域,展示了数值方法是如何有用的,并提供了空间的智能搜索。他说,这种方法可以在比人更短的时间内取得更好的结果。

Devgan还谈到了可持续性。“这对我们的员工、投资者和客户来说都是一件大事,”他说。“半导体是必不可少的,但它们也消耗大量电力。我们有机会降低功耗,功耗将成为PPA的驱动因素——不仅在芯片层面,而且在数据中心和系统层面。与生物系统相比,我们差了几个数量级。”

Steve Teig, perceptor的CEO

Steve Teig, perceptor的CEO

史蒂夫·泰格(Steve Teig)在机器学习应用领域工作了30多年,他相信可以做得更多。“首先,如果我们少依赖民间传说和轶事,多花点时间在数学和原理上,深度学习将会比现在更强大,”他说。其次,我认为效率很重要。仅仅让模型看起来有效是不够的,我们应该担心每美元、每瓦和其他东西的计算吞吐量。”

泰格认为,深度学习令人印象深刻,在15年前还会被视为巫术。“但我们需要认识到它们的神奇之处,”他说。“我们一直在制作更大、更糟糕的模型。我们已经忘记了,在过去100年里,创新的驱动力一直是效率。这就是摩尔定律的推动力,从CISC到RISC,从cpu到gpu的进步。在软件方面,我们看到了计算机科学的进步和算法的改进。当他们在做深度学习时,我们现在处在一个反效率的时代。训练一个大型语言模型一次所需的碳足迹约为800万美元,是驾驶一辆车一生碳足迹的5倍多。地球承受不起这条道路。”

图6:AI/ML模型尺寸不断增大。来源:感知

图6:AI/ML模型尺寸不断增大。来源:感知

他还表示,从技术角度来看,这些庞大的模型是不值得信任的,因为它们会捕捉训练数据中的噪声,这在医疗应用中尤其成问题。“为什么它们如此低效和不可靠?”最重要的原因是我们依赖民间传说。”

他接下来的演讲主题是“一个神话,一个误解和一个错误”。“神话”是平均精度是正确的优化。“有些事情并不重要,而其他错误则更为严重。我们现有的神经网络无法区分严重错误和非严重错误。他们的分数都一样。平均准确度几乎从来都不是人们想要的。我们需要考虑根据错误的严重程度而不是频率来惩罚错误。并非所有的数据点都同样重要。那么如何纠正呢?损失函数必须基于严重程度,而训练集应该基于数据的重要性进行评级。”

“误解”是错误地认为神经网络作为计算设备具有表达能力。“许多假设和定理都非常具体,无法被现实生活中的神经网络所满足。认为网络可以用前馈神经网络任意逼近任意连续组合函数。这取决于激活函数是非多项式的。如果这是真的,我们需要一个任意数量的比特。更令人担忧的是,在这种类型的神经网络中,唯一可以构建的函数是组合的,这意味着任何需要状态的东西都不能被表示出来。有一些定理表明nn是图灵完备的,但当你没有内存时,这怎么可能成立呢?rnn实际上是有限状态机,但它们的内存非常有限。它们实际上是可以计数的正则表达式,这使得它们等价于grep。”

“错误”是认为压缩会损害准确性,因此我们不应该压缩我们的模型。“你想要在数据中找到结构,并将结构与噪声区分开。你想用最少的资源来做这件事。随机数据不能压缩,因为没有结构。你拥有的结构越多,你能做的压缩就越多。学习在原则上是可压缩的,这意味着它有结构。信息论可以帮助我们创建更好的网络。奥卡姆剃刀理论认为最简单的模型是最好的,但这是什么意思呢?数据的任何规律性或结构都可以用于压缩该数据。更好的压缩减少了网络选择的任意性。 If the model is too complicated, you are fitting noise.”

图7:压缩类型。来源:感知

图7:压缩类型。来源:感知

完美压缩是什么样的?泰格提供了一个有趣的例子。“数学已经描述了最佳压缩。它可以通过最短的计算机程序来生成数据。这被称为Kolmogorov复杂度。考虑π。我可以发给你31459等数字,但是一个计算圆周率的程序可以让你产生第一万亿位,而不需要发送那么多位。我们需要摆脱琐碎的压缩形式,比如权重的比特数。100X压缩可能吗?是的。”

Giovanni De Micheli - EPFL EE和CS教授

Giovanni De Micheli - EPFL EE和CS教授
乔瓦尼·德·米开里首先研究了EDA中循环的层次结构,每个循环之间通过某种关系联系在一起。他说:“技术和设计的杂交孕育出了卓越的系统。”

在研究了音乐、艺术和数学中循环的历史存在方式后,他又研究了参与者之间的互动——行业、学术界、金融、初创企业和提供数据交换的DAC等会议之间的互动。他用这一切提出了三个问题。硅和CMOS会永远成为我们的劳动力吗?经典计算是否会被新的范式所取代?生物和电脑会合并吗?

硅和CMOS。德米开里研究了一些新兴技术,从碳纳米管到超导电子学,到内存逻辑,以及利用光学来加速机器学习中的计算。“其中许多都是范式上的变化,但你必须考虑到将这些技术应用到产品中所需要的努力。你需要新的模型。您需要适应或创建EDA工具和流程。在这样做的过程中,你可能会发现一些事情,使你能够使现有的事情变得更好。”

对纳米线的研究导致了静电掺杂,这创造了新的栅极拓扑结构。他还研究了二硒化钨(WSe2),并展示了一个可能的单元库,在其中您可以非常有效地实现异或和多数门等门。“让我们回过头来看看逻辑抽象,”他说。“我们已经设计了数十年的NAND和NOR数字电路。为什么?因为我们一开始就被洗脑了。在NMOS和CMOS中,这是最方便实现的。但是如果你看一下Majority操作符,你会发现它是做加法和乘法的关键操作符。我们今天所做的一切都需要这些操作。你可以在此基础上构建EDA工具,在合成方面表现得更好。”

图8:不同制造工艺的栅极拓扑结构和库。来源:欧洲

图8:不同制造工艺的栅极拓扑结构和库。来源:欧洲

在了解了如何使用Majority操作符的所有背景知识后,De Micheli声称,与以前的方法相比,它可以减少15%到20%的延迟。这是他循环的一个例子,一种替代技术教会我们关于现有技术的一些东西,并帮助改进它,也适用于新技术,如超导电子技术。

“EDA是技术的推动者。它提供了一种方法,让您可以评估新兴技术,并了解在虚拟实验室中什么是有用的。它创造了新的抽象概念、新方法和新算法,不仅对这些新兴技术有益,而且对现有技术也有益。我们知道目前的EDA工具并不能让我们找到最优的电路,因此寻找优化电路的新路径总是很有趣的。”

计算范例。德米开里开始关注量子计算和一些有用的应用。这里的循环需要添加叠加和纠缠的概念。他说:“这是一种范式转变,改变了我们构思算法的方式,改变了我们创建语言、调试器等的方式。”“我们必须重新思考合成的许多概念。EDA是一种独立于技术的优化,将导致可逆的逻辑。它是可逆的,因为物理过程本身就是可逆的。然后映射到一个库。你必须能够嵌入约束。量子EDA将使我们能够设计出更好的量子计算机。量子计算推动了计算理论的发展,包括可以在多项式时间内解决的多项式类问题。 That includes, for example, factoring, and this will impact security.”

生物和电脑。“这里循环的重要因素是进行修正和增强。我们已经用眼镜矫正了1000多年。进展是巨大的。”德米开里讨论了许多当今可用的技术,以及它们如何改变我们的生活。

图9:在医疗应用中创建反馈循环。来源:EFPL

图9:在医疗应用中创建反馈循环。来源:EFPL

“这导致了新的EDA要求,允许我们共同设计传感器和电子设备,”他说。“但最终的挑战是理解和模仿大脑。这要求我们能够解码或解释大脑信号,复制神经形态系统和学习模型。这为可控性、可观察性和连接带来了接口挑战。”

这是第一步。“下一个层次——未来——是从大脑到思想,基本上能够将人工智能和自然智能连接起来。生物学和医学的进步,加上新的电子和接口技术,将使我们能够设计出更好的生物医学系统,”他说。

结论
以最有效的方式执行一项任务涉及很多人。它包括仔细设计算法、运行这些算法的平台、用于在软件和硬件、硬件和硅之间执行映射的工具,或者一种替代制造技术。当每一项都单独进行时,它可以带来小的改进。但是,当每个参与者以伙伴关系的形式一起工作时,就会出现重大的改进。这可能是阻止地球继续遭受破坏的唯一办法。



留下回复


(注:此名称将公开显示)

Baidu