一对一:约翰·李

将大数据技术和机器学习应用于EDA和系统级设计。

受欢迎程度

Ansys公司总经理兼副总裁John Lee(他曾是数据分析公司Gear Design Solutions的首席执行官,该公司于去年9月被Ansys公司收购)接受了《半导体工程》杂志的采访,探讨了大数据技术如何应用于半导体和系统设计。以下是那次谈话的节选。

你的目标是什么? Gear已经被有限元分析软件

:我们有一个独特的使命,那就是为任何产品提供基于多物理的模拟。我们模拟电力完整性。功率与热有关。设备的温度会影响功率,进而影响计时。芯片上的电源、定时和开关也会吸引电磁干扰。加热会影响系统中电路板的包装。如果你在设计第二好的智能手机,你会关心硅。你关心电力的完整性。但多物理指的是手机作为一个你拿在手里的机械设备是如何运行的,它是如何连接到互联网的,上面的计算需要热建模、机械建模——冷却系统的流体动力学,板上封装的机械建模——然后上面的所有电子器件来模拟芯片的物理。我们离这个愿景还很远。 Rather than going to physical test of the device where you predict something by simulation, whether that’s a phone or the Tesla Hyperloop or the next airliner out of Boeing, the issue is how much of that we can simulate going forward.

SE:所以这是一个大的蓝图,以及所有低至10nm及以上的技术,对吗?

:是的。我们必须专注于从3D网格和矩阵解决方案到高性能计算的所有事情。如果你从EDA的角度来看,我们在模拟和算法方面聘请了最好的计算机科学家,用他们来提高地点、路线和计时的效率。如果你回头看看我们的使命宣言,为了真正在我们客户正在建造的设备(物联网设备、自主系统、进入数据中心的设备)的规模上计算这些多物理场,你可能希望有10,000到100,000台机器同时处理。这种处理所产生的数据量是巨大的。在一个芯片上,你有40亿个实例或200亿个晶体管或2000亿个形状。这是一个大数据问题。仅在一个芯片上,我们就有比世界上人口还多的晶体管。每个晶体管由许多形状表示,每个形状都有与之相关的温度、电压和功率。那么,我们如何利用EDA之外的所有伟大的计算机科学想法,将其转化为一个平台,从而加速实现这一愿景呢? And how do we use the techniques that make Facebook or Google these buttery smooth commercial-facing apps, which are all based off big data systems.

SE:你们在这里着眼于什么样的平台?

:专门为科学计算(基于物理的模拟)构建的大数据平台是我们构建令人惊叹的EDA工具的最佳方式。大数据帮助我们回答有关搜索的问题。如果你看看谷歌是怎么做的,他们从来不知道你会问一个问题,但他们提供了很多可用的数据。

SE:通过预取方案?

:是的。这就是我们不需要重新发明轮子的地方。目前已经存在一些技术和算法。像MapR Technologies、Cloudera和Hortonworks这样的数十亿美元的创业公司致力于计算机科学的研究。您可以下载Hadoop开源。在键值对或日志文件或上下文信息上进行搜索,与告诉我芯片中哪个关键网络靠近敏感区域非常不同,该敏感区域可能在10纳秒内切换,有很高的IR下降问题。我们想做一些类似的事情。我们一直在建立这个系统。如果你看看现在的大数据系统,你会发现它们在计算方面确实面临挑战。他们非常擅长MapReduce之类的东西。 But if you want to start doing matrix computation on that or graph computation or geometry computation, that whole set of new billion-dollar startups is innovating on that.

SE:那么EDA在哪里呢?

我们知道如何做静态时序分析。这是基于图表的分析。我们知道如何构建DRC和RC提取工具。这就是基于几何的分析。我们知道怎么做香料仿真,FastSPICE仿真,IR滴仿真。这都是矩阵。EDA归结为矩阵、图形和几何的这些基本服务。如果你能把它放在一个大数据系统上呢?

SE:这不是仿真在某些问题上所做的吗?

:在EDA,我们一直擅长构建专业的解决方案。这是用于加速验证的专用硬件,这就是为什么您看到对这些产品的需求迅速增长的原因。如果你看看EDA以外的领域,40年前的计算机科学专业的学生知道穿孔卡片和汇编语言。现在大多数EDA开发人员都懂c++。在Facebook这样的公司,他们知道如何在更高的层次上编程。他们使用Java或Python,并利用系统和软件堆栈将大量新应用程序组合在一起。这个平台的前提是,通过为开发人员和设计人员提供不针对单个问题的高级工具,这个平台可以让我们扩展到更大更好的东西。

SE:如果你提高抽象性,你就可以做得更多。但你也会遇到问题,对吧?安全就是一个例子。如果您不了解所使用的系统的复杂性,您可能会忽略漏洞。

:说得好。如果您是高级程序员,则不了解这些漏洞。这是一个挑战。因此,只要我们可以从开源中重用,有10,000名开发人员在几年的时间里研究它,这是一个好处。然后你必须严格审核系统。我们拥有所有这些c++机制。但是你要如何模拟这个世界呢?谷歌的方法是采用低成本的Linux或pc,将尽可能多的Linux或pc放入数据中心,然后使用分布式数据和分布式计算来实现这一点。他们不需要每个开发人员担心如何将这个分配到这里,这个分配到那里,这是我们在EDA中所做的。他们提供了这个系统,所有的开发人员都在上面。 You want to provide the level of services that allow you to utilize massive distribution. You cut up the data and then you figure out how to handle communication between machines, scheduling of processing between machines. We believe that having a formal system based on the best computing systems outside of EDA is going to allow us to scale new applications and services much better and much faster.

SE:这在多大程度上依赖于并行处理?

:它专注于这一点,但采用了不同的方法。所以你可以专注于最佳的计时工具或最佳的位置和路线工具或最佳的综合工具,然后你提出算法,然后找出如何并行化它。在不同的工具中使用的并行化是非常不同的。它们的不同是有原因的。但如果你有一个平台,所有这些都是为你做的。有了谷歌搜索,你可以问任何问题,它立即缩放并返回给你。如果你看看Hadoop和EDA之外的其他系统,它们上面有这些机器学习统计数据。一旦你可以处理大量的数据,那么你就可以把这些机器学习算法放在它们上面。您不必重新实现所有这些已知的技术。它将适用于计时、电力、热、机械——所有这些不同的应用程序都将能够利用这种机器学习。

SE:你能用这种方法做更多的权衡和分析吗?

请记住,我们已经走上这条路三年了。这还需要很多年的时间。但我们首先关注的是为芯片设计师提供更好的可视性——更好的搜索工具和地图工具。对设计师来说,获取数据非常重要。我们的直觉和思想比大多数自动化软件做得更好。但是你不能将其缩放。所以第一个挑战是给设计师一种方法来看待他们的数据,就像我们作为消费者一样。所有芯片数据都应该可以立即访问,无论数据来自何处导师图形Synopsys对此节奏.这些都是可互操作和可搜索的。下一步,既然一个人可以继续并开始搜索,那就是使所有这些都有用。工程师们能用最简陋的工具做的事情真是令人惊叹。我们想办法设置和建造东西。这些设计师拥有很棒的工具,但并不完美。所以如果你给他们一个大数据系统,他们不仅可以搜索,还可以开始构建流程和优化。“我知道当我这样做,这样安排事情的时候,我得到了一个很好的结果。“那么,如果你给他们一种高级的方式来推动和发号施令呢?”这是在获取设计师的知识,让专家为他们构建非常棒的流程,让他们做一些他们现在不能做的事情。

SE:所以你在寻找更高效、更快的系统,以及更快的构建方式,对吗?

:对。很多产品的过度设计,都是因为你不了解某些东西。在竞争中,当你从一种半导体和另一种半导体中取出一个芯片时,它们的利润率是不同的。这会影响盈利能力、业绩和上市时间。如果你不需要增加保证金呢?你会做出更好的选择。我们看到的一个好处是过度设计的减少。实际上,这意味着您可以选择更便宜的包装,使用更少的电力,在您交付的产品中有更少的可变性,或者您可能在产品计划中有更多的可预测性。也许你因为发现了问题而推迟了六个月。这就是我们看到的一些好处。

SE:最终的目标是出售数据库,还是像IBM的沃森(Watson)那样的知识?

今天我们卖工具。机会是有的。数据比计算更有价值。进行计算的机器是必不可少的,但对于最终用户来说,重要的是知识以及他们可以用这些知识做什么。就商业战略而言,我们不知道这将以何种方式或方向发展。但任何与客户的最终目标更接近的机会都将是双赢的。他们受益,我们也受益。但我们真正的使命是为设计师提供类似google的工具,这样他们就可以对自己的产品进行基于多物理的模拟。动力、热量和计时现在是不同的引擎和不同的产品,具有不同的文件、不同的外观和感觉,以及不同的研发团队。

SE:所以第一步是统一所有这些内容?

:至少提供一个框架。我们需要一个好的平台把这些东西放进去。这将是一个巨大的开始。这是一个长期的愿景,但一旦我们可以将所有这些基于物理的引擎放到一个平台上,无论你使用的是1000个gpu还是100万个定制asic,所有这些都由平台处理。这对EDA来说可能是革命性的,但对半导体以外的所有处理来说并不是革命性的。这就是模拟的民主化。



留下回复


(注:此名称将公开显示)

Baidu