机器学习越来越受欢迎

经过20年的试验，半导体行业正争相采用这种方法。

2017年7月26日-由:安Mutschler

机器学习和深度学习在许多行业都呈现出急剧的增长轨迹。就连通常抵制这种技术的半导体行业也开始改变态度。

这两个机器学习(ML)和深度学习(DL)已成功用于自动驾驶中的图像识别，自然语言处理应用中的语音识别，以及医疗保健行业的多种用途。普遍的共识是，它可以类似地应用于半导体设计。

不过，这并不是什么新想法。ML和DL在芯片设计中的基础可以追溯到近20年前，而ML/DL的概念可以追溯到另外30年前。

加州大学圣地亚哥分校计算机科学与工程教授安德鲁·康格(Andrew kang)说:“我们在1998-1999年将其称为‘指标’。”“主要原则是衡量一切，挖掘日志文件，预测工具的最佳点和故障点，并找出如何针对特定的设计实例调整特定的工具选项。”

这在纸面上讲得通，但实际应用却滞后。

“当时所有人都对它过敏，尽管德州仪器和英特尔内部都有指标计划，”kang说。“20年后，这就是我们作为一个行业所寻求的——基本上是帮助EDA提供可伸缩性，其中可伸缩性不仅是结果质量(QoR)，而且是进度。如果你能预测失败，如果你能减少错误相关性，也就是利润和美元，那就有巨大的价值。有这么多唾手可得的东西，真的很神奇。在目前和近期内，机器学习肯定是EDA的首选。对于深度学习，这很难说。”

Cognite Ventures的首席执行官克里斯•罗文认为，EDA/IP行业将参与两个截然不同的领域——虽然目前还没有联系，但随着时间的推移，它们可能会融合在一起。“首先，深度学习特别代表了一个非常基本的新计算概念——它是统计计算，而不是冯·诺依曼计算，甚至是图灵计算。从这个意义上说，在IP中有机会提供各种引擎，事实上，在工具中也有机会——就像EDA提供工具，允许人们构建传统的、非统计的计算系统一样。它将提供工具，允许人们进行培训，以优化网络机会，可能在数据增强/数据创建业务中也是如此，因为这些是计算困难，技术复杂，对于任何正在构建任何东西的人来说都是必不可少的构建块算法。因此，EDA行业有一个角色，或者看起来很像EDA行业的东西，参与其中。但这在很大程度上是EDA行业必须做出决定的。这不是自动发生的。”

Rowen说，第二个领域涉及到使用这些统计方法来提高EDA工具在仿真、模拟、功率分析、地点和路线、建模和验证方面的复杂性。“最终，最大的机会，可以说是EDA的可取之处，是提升并参与统计计算系统的创建，而不仅仅是在传统的物理实现和传统的模拟和数字建模上做得更好。”

但这一切都不是自动发生的。EDA公司对投资非常谨慎，这解释了为什么他们出于经济原因和舒适区而放弃参与软件工具领域。从某种意义上说，ML和DL是超越这一点的一步。“但与编译和其他一些东西不同，这实际上是一个非常难计算的问题，你可以想象，人们会说，‘我愿意花很多钱来得到一个更好的5%的解决方案，’”Rowen说。“这就是为什么EDA工具变得如此有价值的一个特点。在某些情况下，情况也是如此，因此EDA行业可能存在蓬勃发展的巨大市场机会，但这是一个延伸。”

使用ML和DL
ML是一组算法，使计算系统能够从大型数据集中识别模式。深度学习将多层人工神经网络添加到涉及大量输入数据的应用程序中，并得出可以应用于新数据的推论。因为芯片设计会产生大量的数据，所以ML和DL都很有用。

尽管如此，为了从ML和DL中获得最大的好处，必须深入考虑在哪里以及如何应用这些技术。

“机器学习绝对与EDA相关，但为了获得最大的利益，你必须在工具内部和工具周围考虑机器学习，”Sashi Obilisetty说Synopsys对此．“因此，如果您正在进行ECO作业，您可以利用这些工具优化许多必须进行的功率或时序模拟。ML可以用于更好的调度正式的例如工具，它已经被用于制造业。它用于掩模合成。毫无疑问，它将在内部改进我们的工具。我们还需要考虑的是如何在EDA工具周围使用它。这是关于自动化任务。我们如何找到类比?如何自动分析日志文件?如何进行智能资源配置?我们有很多新工作和新想法可以实现，以便更好地与环境、铸造厂和工具合作。”

这也为公司提供了一些有趣的机会。诺曼·张，首席技术专家ANSYS的他说，他的团队开始研究如何使用ML/DL进行图像识别和自然语言处理。但经过两年的搜索，ANSYS没有找到一家完全专注于机器学习/深度学习的初创公司，所以它决定自己进入这个市场。

Chang说:“在ANSYS内部，我们努力在我们的领域，即模拟领域，研究机器学习和深度学习的可能应用。“这是一个使用大量计算技术的传统行业。它是非常确定的，而不是启发式的。当我们着眼于模拟世界时，我们将目光从设计输入转向模拟。从7nm到5nm的设计输入组合越来越大。每个块的向量数量越来越长，以覆盖低频到高频。因此，除了多切换场景和多端口外，设计输入的向量组合也在增加。对于大的CPU，内部可以有超过100个CPU端口。如何确定能够提供完整覆盖的切换场景，以及能够捕获所有可能问题的良好切换条件?从输入选择的角度来看，有机会使用机器学习来减少输入的选择。”

对于设计本身，也有机会。Chang指出，生成对抗网络(GAN)技术在去年变得非常流行。ANSYS已经证明，它可以在适当的约束条件下，自动提出许多可能的设计品种。他认为EDA行业也可以使用ML/DL进行输入选择和输入降维。对于核心仿真，可以建立代理模型和优化模型，加快仿真速度。然后，经过长时间的模拟，可以建立神经网络模型，设计人员可以使用该模型进行插值/外推，以预测其他条件。

然而，ML可能应用的另一个领域是各种模拟工具输出的相关性。

“产生了很多数据，”Chang说。“我们希望将来自不同工具的数据放在一起，然后为预测分析提供诊断经验基础。在这方面，我们必须和个别客户谈。每个客户都明白其中的含义。他们知道他们想要什么，所以我们的想法是，我们想要提供一个平台，我们可以在机器学习和深度学习模块的基础上，帮助客户实现他们的应用程序，并加快应用程序的开发。这也有助于优化整个循环。”

在ML/DL中有一个作用验证也一样。在功能验证方面，有几个领域可以应用它。

“首先是回归减少，”验证首席科学家哈里福斯特说Mentor是西门子旗下的公司．“第二点正在改善报道，例如使用无监督学习来识别异常值并探索异常值。第三，尽管有些覆盖指标在IP子系统单元层面是有效的，但它们在系统层面毫无意义。在该地区统计覆盖的整个概念意味着使用学习技术提取有意义的信息。”

使用数据
然而，与许多其他ML/DL应用程序相比，功能验证具有不同的起点。

福斯特说:“我们面临的挑战之一是，与许多领域不同，我们实际上没有很多数据。”“例如，我开始一个新项目——我没有很多数据。甚至在模拟．其中有很多可能是有偏见的，并且并不总是有趣的场景，所以为了成功，至少在功能验证中，我们必须将领域知识与数据结合起来。如果我有一个连贯的结构，我试图确定结构中缓存的效率，我需要聪明地探测，以确定我是否可以开始提取这些缓存的有意义的信息和关系。”

这是成功应用ML/DL的关键。“数据的大小真的很重要，把机器学习和深度学习区分开来尤其重要，”Rowen说。“有时这两个短语被混为一谈，因为机器学习真的是一个超集短语，但现在被称为机器学习的很多东西已经在25年里逐渐、优雅和毫无争议地发展起来，人们经常使用它们。这就是数据科学家的工作。试图将模型规模扩大到我们现在所说的深度学习，其实有着更加曲折的历史，直到过去五年左右，我们在其中一些问题上获得了足够的数据。”

这并不适用于半导体设计。

Rowen解释说:“每个人都在看ImageNet基准，因为它是AlexNet和GoogleNet以及其他所有东西的进化基础，它有一个600亿像素的训练集，你可以训练一个包含1000或5000万个参数的模型。”“你通常需要一个比你需要的模型大得多的训练集，模型的聪明和智能在某种程度上与参数的数量成正比。在数据科学家的工具箱中有一个平滑连续的机制，它允许您构建越来越大的模型，以及不同特性的模型。但模型的大小，以及模型的感知智能，很大程度上取决于你的训练集有多大。没有绝对的数学关系因为你可以有更好的训练集和更差的训练集。但除非你谈论的是拥有至少数百万个数据点的东西，否则很难说你会用这些多层网络进行深度学习。在我们研究的很多问题中，我们有很多数据，但我们没有数百万个向量。”

换句话说，数据越多越好，这意味着芯片制造商和工具供应商需要想办法收集更多数据。

Rowen说:“如果在制造过程中，我们真的通过大量晶圆中每个开口和短板的位置获得了良好的产量统计数据，那么我们就能够建立一个模型，将其投射到输入几何图形上，我们就可以拥有超级设计规则。”“这意味着真正适用的设计规则，而不是我们从几千条规则中得出的近似，这些规则是某人从几个测试芯片中开发出来的。这依赖于从生产线上获得千兆字节的数据来告诉我们这些缺陷的确切位置，并测量准确的数据点，因为这为掩模几何形状创建了标签。但对于我们所做的很多事情，我们都没有做到。此外，我们在功能验证中需要做的一些任务不是统计的。他们不是黑的就是白的。我们不想以99.99%的把握知道这个逻辑电路实际上做了它应该做的事情。我们可能有很多统计机会来找到更多的报道，帮助我们梳理出最后一点。”

结论
那么，在EDA中利用机器学习开展业务的决定性因素是什么呢?今天的工具开发人员如何决定要做什么，并投资于什么?

kang认为，这将是由客户端推动的。“机器学习最终将缩短设计周期，更有效地使用EDA许可证。因此，更少的许可，更短的设计周期——这是EDA工具开发人员真正感兴趣的东西吗?哪里对机器学习的需求最大?当你处在启发式的最前沿，大量的启发式开始崩溃，结果变得混乱。这对机器学习来说是一个真正的机会。你如何预测这额外的0.25%的利用率是否会决定你的平面图?机器学习在回答这类问题上表现出色。当工具非常混乱时，你有另一条机器学习的道路，我们将在没有人类参与的情况下实现大规模的云自动化——让AI找出如何最好地为你的设计练习流程。这比等待小数据问题解决要好得多。”

英伟达高级工程总监顾廷(Ting Ku)表示，对于使用这些工具的人来说，如果这些工具太好了，他们担心的是是否会扼杀工具行业的增长。“这很荒谬，因为如果你给我一个更好的工具，我就可以用更少的工程师，或者不那么聪明的工程师。我不再需要训练有素的工程师了。这对我很有价值。我是否会花更多的钱来抵消一个更小的工程人员的需求，而不是一个聪明的员工?不是每个人都有博士学位，也许硕士学位就足够了?我当然愿意付更多的钱。这绝对是事实。只是因为我减少了模拟，减少了使用许可，这并不意味着我损害了EDA的经济利益。”

福斯特表示同意。“在测试中，我们学习了如何在测试器上更有效地进行测试压缩。事实证明我们并没有做得更少，我们意识到还有其他东西可以测试。所以它打开了产能，所以我不认为我们会减少工作量。我们还能做得更多。”

有关的故事
机器学习的黑暗面
机器学习需要防止对抗性使用的技术，以及更好的数据保护和管理。
机器学习与集成电路设计
机器学习可以在多个层面上帮助半导体的创造，但实现这一点并不像其他应用领域那么简单。
机器学习竞赛
随着技术开始成型，芯片行业重新定位;目前还没有明确的赢家。
填补机器学习中的漏洞
第2部分:确保机器按预期运行的短期和长期解决方案。
机器学习缺少什么
第一部分:教机器如何行动是一回事。在此之后了解可能的缺陷是另一回事。
制造能学习的芯片
机器学习，AI，需要的不仅仅是功率和性能。
人工智能芯片长什么样?
随着人工智能市场的升温，关于如何构建这些系统的困惑也在升温。
AI风暴正在酝酿
人工智能的加速发展将对社会和商业产生重大影响。

安Mutschler

(所有的帖子)
Ann Mutschler是《半导体工程》杂志的执行编辑。

1评论

伯纳德•墨菲说:

2017年7月26日上午10:32

安，好文章!

机器学习越来越受欢迎

安Mutschler

1评论

留下回复取消回复

知识中心博客

冯·诺伊曼建筑

深度学习(DL)

机器学习(ML)

模拟

技术论文

热门文章

浮点8能解决AI/ML开销吗?

选择正确的高带宽内存

选择正确的RISC-V核心

铁电记忆:中间地带

通往已知的良好互连的路径

知识中心
探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

所有的半导体投资都去了哪里

定制的硅响尾蛇芯片设计生态系统

浮点8能解决AI/ML开销吗?

芯片架构的基本变化

RISC-V推向主流

RISC-V芯片有多安全?

赞助商

最近的评论

关于

导航

与我们联系

机器学习越来越受欢迎

安Mutschler

1评论

留下回复取消回复

知识中心博客

冯·诺伊曼建筑

深度学习(DL)

机器学习(ML)

模拟

技术论文

热门文章

浮点8能解决AI/ML开销吗?

选择正确的高带宽内存

选择正确的RISC-V核心

铁电记忆:中间地带

通往已知的良好互连的路径

知识中心探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

所有的半导体投资都去了哪里

定制的硅响尾蛇芯片设计生态系统

浮点8能解决AI/ML开销吗?

芯片架构的基本变化

RISC-V推向主流

RISC-V芯片有多安全?

赞助商

通讯注册

受欢迎的标签

最近的评论

关于

导航

与我们联系

知识中心
探索实体、人员和技术