AI采用慢设计工具

虽然采用ML是健壮的,完整的AI缓慢着火。但这在未来可能会改变。

受欢迎程度

大量的兴奋,和大量的炒作,围绕人工智能(AI)能做什么为EDA行业。但必须克服许多挑战AI开始设计之前,验证,和实现芯片。应该今天AI替换算法在使用,或者有不同的作用吗?

在一天结束的时候,AI技术的优点和缺点,并比较与那些已经在使用。现有的算法和工具有几十年的数据和经验,封装,和小知识是可用的形式,可以培训新人工智能模型。使这些机构用技术处于非常不利的地位,一个需要时间来克服。但人工智能不需要对所有任务类型的数据。一些任务产生出大量的相关数据,这些都是那些早期结果显示很多的承诺。

问题一直都是可用的数据是有用的?“有成千上万的运用机器学习的方法,“于丹说,产品经理毫升在集成电路设计验证的解决方案西门子EDA。“机器学习是一个通用的技术,这实际上取决于人们如何看待这个问题,人们希望使用数据来解决问题。一旦我们有了更多的数据,一旦我们注意的质量数据,随后我们会聪明和聪明的人工智能模型。这需要时间。”

EDA在芯片行业的作用相当明显,和EDA拥抱机器学习EDA的,这是一个子集。但更广泛的AI如何适应EDA远没有那么明显。“我们将EDA当它能帮助你完成你的工作,或者完成任务或更好更快,“院长Drako说,总裁兼首席执行官的IC卡管理。“两件事,我们希望从EDA行业设计速度和使它更好。我们都是人类,我们会犯错误。人的问题,他们生病,他们只希望每天工作8或10个小时。如果你可以有AI做更好,或使人更有效率,那么这是一个重大胜利。它是关于生产力。如果爱让我生产,我赢了。”

EDA行业找到合适的任务,提供这些好处,今天与数据可用,哪些是可能的。“人工智能很有成功的机会,当试图复制人类擅长的任务,”托马斯·安德森说,副总统为人工智能和机器学习Synopsys对此。“Place-and-route不是人类擅长的任务。任何简单的算法将击败人类,因为人类不擅长把事情在这个数量,同样一个简单的计算器将击败大多数人类。人类会打败它更多创造性的任务和更复杂的任务——认知类型的东西。”

人工智能只是另一个算法在阿森纳,和机器学习的一个子集。“线性回归是现在被认为是被机器学习,但是人们已经使用回归很长一段时间,”米甲Siwinski说CMOArteris IP。“这是一个统计概念可以追溯到很长一段时间。从根本上说,这些都是不同类型的算法,它是一种发现算法对于一个给定的任务变得更高效。之前我们有卷积神经网络,它是很难有效地解决方面的远见和大型语言模型的各个方面。”

做任何的工作都需要正确的数据。“人工智能和机器学习基本上是学习从历史数据,从数据积累,“西门子Yu说。“这凝结知识从数据。重要的是您给您的人工智能模型的数据训练,有效地提取知识。你用这些知识来预测将会发生什么如果我得到一个新情况。AI基本上是拯救我们的努力复制不必要的工作。”

但缺乏数据可以创建问题。与人工智能”必须要小心,因为它离群值的问题和故障,”马克说Swinnen产品营销主管有限元分析软件。“你不能依赖它总是给你一个好的答案。设计任务可能更受欢迎,因为你需要快速周转和迭代计算在放置或路由。你可能离开离群值,直到后来验证阶段,更容易比试图修复它使用一个生态考虑所有角落情况下每次决定——尤其是当他们很少适用。在签字,目的是捕获异常值”。

优化函数依赖于成本函数。“深度学习,或任何其他机器学习技术,基本上是最小化给定的成本函数,“说Arteris Siwinski。“这是它背后的数学是如何工作的。成本函数是受制于你如何定义成功是什么,和参数是什么样子。”

数据的问题
第一个问题不是计算能力或模型。它的数据。“如果你只训练你的模型对当前设计,然后人工智能的知识是非常有限的,”Yu说。“你的成功率取决于你有多少数据积累。如果你有一个系列的设计、增量或衍生品的设计,这将帮助。也许你是一个设计公司,设计了许多客户。如果你有训练有素的模型设计和设计B只会有轻微的修改,然后你可以重用模型。现在你的成功率会更高。一些验证工程师更有经验,可以将他们从以前的项目的一个新项目。这里的也是如此。 We need the data to train the right model.”

与人工智能算法通常是使用广泛的训练数据来创建一个模型,然后可以高度优化的性能和推论的一面。“我们正在做完全训练模型,其中一些专有的客户,为特定的用例设计他们想要的,”Paul Karazuba说负责营销的副总裁Expedera。”而不是使用一个通用的设备,客户有具体他们想做的事情,他们想要我们去处理它们尽可能优化。建筑设计的意图是可伸缩的,而且优化。”

EDA的更大的挑战是如何让数据跨越整个行业为了自动化的步骤。“半导体设计行业将是一个行业发现最难的,“IC卡管理的Drako说。“设计是严重保护和梦寐以求的。甚至在台积电的设计规则是严格保守的秘密,和他们试图加密。太阳底下没有人希望他们的设计数据公司以外的任何地方。我们将有一个艰难的挑战,作为一个行业。我相信我们最终会克服它。我们做到了合成,place-and-route。见过许多设计的工具,因为每次有一个错误,我们给EDA公司数据,这样他们就可以修复bug”。

一些更积极,尤其是当涉及到机器学习。“半导体行业非常丰富的数据,“Siwinski说。“你有这么多的设计,所以很多情况下每年soc设计,新一代的衍生品,类似的事情用不同的架构,上百万的测试向量贯穿数百个角落用例检查。这意味着它是一个机器学习的好地方,因为机器学习算法不是真正的。这是比较容易的部分。它是关于能够框架声明你想解决的问题,正确的数据来支持它。如果你能正确的帧,你绝对可以使用机器学习。”

也可以通过使用更少的数据和数据共享,这更多的是一种问题比它的机器学习和人工智能的子集。“我无法想象,因为那样就没有竞争优势为任何人了,“Arvind Narayanan说,高级主管在Synopsys对此产品线管理。“所有行业,有时候有很多的玩家创造一个财团分享技术。整个行业会在一起,基本上把所有的信息?我只是没有看到它。我看不到未来,因为每个人都非常保护自己的知识产权,我明白为什么他们。”

数据共享,使每个人都神经兮兮的。“有很多合作,继续,“Drako说。“这不是谈论了很多,因为它使所有的芯片公司非常紧张。在训练模型,它变得困难,因为供应商要求的数据保持在较长时间内。会有很多问题。”

也有数据的有效性和一致性问题需要考虑。“如果你应用相同的过程用于创建ChatGPT芯片设计的世界里,我不能使用任何RTL有人写过,”安德森说Synopsys对此。“需要有质量的组成部分。我不仅需要知道这RTL是好的,但也RTL有利于什么目的。可能有不同的需求的QR或功能”。

风险厌恶情绪
半导体行业一直都是规避风险。“人工智能会犯很多的错误,因为训练数据或模型和解决方案是新的和未经证实的,“Drako说。“然而,AI会给同样的答案,对或错,一致。人类不这样做。一旦我得到我的模型,证明它足够准确的为我的任务,我可以确信它会足够准确的从那时起。人类的问题是,如果我火车有人和他们足够准确的第一年的第一个月,我仍然会得到错误在第二和第三和第四年。也许谈论错误不正确的事情。也许一致性是正确的方式思考。”

避免问题的一种方法最初是专注于优化。“通过设计,优化系统不能比你的参考设计,”安德森说。“你可能寄错了方向错误的输入,然后搜索错误的空间,你永远也找不到一个更好的结果。更糟糕的是会自动被丢弃的所有结果。”

错误发生。“结果你得到有关你投入多少努力建设它,“Siwinski说。“很effort-intensive正确。如果你问错了问题,或如果你给错误的数据,然后结果不会很好。你需要了解它只是问正确的问题。你怎么看数据集?你怎么分区你怎么做?这是一个艺术和科学正确。”

你必须理解当错误不能被容忍的。“是有限度的多少我们可以依赖于人工智能,“说Ansys同化。“这的确扮演了一个重要的角色在优化,而且在热分析。例如,使用可变大小啮合时,我们需要一个算法,快速确定可能的热点在哪里,然后我们可以构建网格更紧,我们知道我们需要他们和宽松,不是必需的。允许我们加速整个过程明显用AI智能识别哪些领域需要集中,但最后,计算必须准确。”

生成EDA
尽管AI的话题很受欢迎,它是生成人工智能,是当今热门技术。人们问当AI能够产生Verilog或替换约束随机测试模式生成。“人们使用人工智能编写软件程序,“Drako说。“这是提高他们的生产力,因为它的一些乏味。我需要编写一个程序来做X,这不是我想要的,但是如果我改变这一状况,解决这个问题,在这里,那么繁荣,这很好。所以能提高工作效率,我们将看到它非常有效地用于方法或以这种方式我称之为设计或创意产业”。

但是,半导体行业不一样由生产力软件。“激动人心的性感,眼睛捕捉的这些东西现在,炒作在过去两个月一直很高,现实情况是,很多这些模型都有很长的路要走,”Siwinski说。“我们能得到一些图像处理和创建吗?绝对的。音乐和其他相关的语言模型,是的,这些都是越来越复杂。是一样能够创建先进的代码是安全的,这将是安全的,这是不会的一些挑战IP重用吗?有些地方人们可以得到图书馆的事情,这是伟大的,但他们不一定我部署在高性能的程序,你需要有高可靠性、高安全”。

再次回到训练。“这种力量从何而来?”玉问道。“力量来自大量的数据被送入培训。OpenAI没有披露的数据量他们利用最近GPT-4训练,但是我知道GPT-3他们用数十亿的令牌,这意味着从维基百科,他们收集了所有的数据从公开访问的网页,和许多书籍和刊物。这是情报是从哪里来的。它在GitHub训练。所以它有很多GitHub送入语言模型中。当你看EDA问题,我们获得这么多数据正确培养一个强大的模型?”

于最近发表了一篇论文,提供了如下所示的数据。作为对比2022年8月,21841年有14197122图片类别用来训练ImageNet。

图1:数据从“机器学习应用功能验证的调查”于丹,哈里·福斯特和Tom Fitzpatrick西门子EDA。资料来源:DVCon 2023年

图1:数据从“机器学习应用功能验证的调查”于丹,哈里·福斯特和Tom Fitzpatrick西门子EDA。资料来源:DVCon 2023年

有一些早期的尝试。“你可以告诉AI创建RTL但它是最优化RTL满足PPA的需求?”Narayanan问道。“我们还没有做到这一点。它会吐出的逻辑函数,你在找什么,但第二步是你如何优化它。你怎么把它到下一个水平?这是工作。”

作为一个产业,我们确实有一些经验。“危险与语言模型是你可能花更多的时间调试写得很差的RTL比你会写,“安德森指出。

这类似于早期的IP重用,大量的贫困RTL涌入市场。“即使AI给出了RTL,我们仍然要做质量检查,”Yu说。“也许在未来也可以自动化。我们也必须整合,与其他部分的设计,并确保新的设计作品作为一个整体。有许多步骤,直到一些模型可以产生一个完整的设计。”

结论
阿瑟·c·克拉克曾说:“任何非常先进的技术,初看都与魔法无异。”

“人工智能可能是奇妙的,但它不是魔法,“Siwinski说。“这只是科学和数学。机器学习是另一种工具,非常视,你必须问正确的问题。但这是每个人都应该接受无处不在,因为它是100%。”

虽然EDA是采用机器学习以及其他一些真正的人工智能,它还没有准备好扔掉许多现有的算法。“机器学习不是作为我们现有的替代算法或工具,”Yu说。“他们正在帮助我们加速并不是很有效。他们帮助一些过程自动化人的循环。这是任务,机器学习可以帮助。有时机器学习也可以提高我们的以前的原始算法,使他们更加准确。”

与此同时,生成EDA可能要再等一段时间。“目前尚不清楚这是怎么在我们行业,这是非常厌恶风险,”Drako说。“人工智能将用于设计东西的地方检查由人类,给人类一个模板,然后他们可以更有效地前进,速度更快。我们的行业要保证人。最终,我们会得到模型训练的很好,我们会得到担保。”



留下一个回复


(注意:这个名字会显示公开)

Baidu