中文 英语

在云端设计芯片的艰难之路

EDA生态系统正处于转向云的早期阶段,但并不是所有的东西都将转移到云上。

受欢迎程度

EDA正在断断续续地向云转移,因为工具供应商正在整理复杂的财务模型和权衡,同时认识到一个潜在的巨大新机会,即使用现收现付的方法提供无限的处理能力。

根据所有人的说法,随着EDA供应商和用户深入研究如何以及为什么迁移到用于芯片设计和验证。今天,并不是所有的工具都可以在云中使用,拥有自己数据中心的公司可能会继续使用它们。但EDA云计算为工具公司、老牌芯片制造商和希望尝试不同架构和设计的初创公司带来了新的机遇。

该公司物理验证产品管理高级总监Michael White表示:“如果你可以访问更大的资源池,你就可以大大缩短周转时间,更快地完成设计。西门子EDA。“例如,使用on-prem,你可能每24小时检查一次,但使用云,你可以每天进行三次物理验证。你可以为设计师提供持续的反馈来解决问题。通过获得更大的资源池,生产率的提高为市场带来了真正的时间优势。如果你是第一个进入市场的人,你将能够获得高于竞争对手的平均销售价格。”

图1:每个节点所需的复杂度和检查次数的增加大大增加了芯片设计所需的计算量。来源:西门子EDA

图1:每个节点所需的复杂度和检查次数的增加大大增加了芯片设计所需的计算量。来源:西门子EDA

作为一个行业,EDA在这方面的转变相对缓慢。在过去,这主要是由于在竞争激烈的市场中对知识产权的安全担忧。但是安全性已经提高到被认为比内部数据中心更好的程度。包括零售、银行业和制造业在内的其他行业也支持这一趋势。Gartner预测,到2025年,大约80%的数据中心将转移到云端,以利用处理弹性和容错能力。

芯片设计在实现这一飞跃方面一直进展缓慢,但有几个因素正在推动该行业在云计算方面做得更多:

  • 谷歌、亚马逊和Facebook等系统公司,以及汽车原始设备制造商,现在都在开发自己的芯片,许多公司不像长期芯片制造商那样在工具和内部数据中心上投入巨资。
  • 芯片越来越大,越来越复杂,这是由使用自定义架构的更多领域特定设计所驱动的,每个设计都有独特的依赖关系,并且对更长的寿命的期望越来越宽。大规模的模拟、仿真和原型设计被认为是在压缩的市场窗口中推出可靠芯片的关键,即使是拥有巨大内部计算资源的最大芯片制造商也需要在有限的时间内提供额外的计算周期。
  • 全球越来越多的公司,包括许多初创公司,正在开发更小的芯片,以及新接口、新类型的内存,并试验各种互连方案。为了让这些公司具有竞争力,他们需要将有限的资源集中在工程上,而不是建立内部仿真和模拟农场。

虽然最大的EDA公司在过去10年里一直在尝试基于云的服务,但进展缓慢。事实上,直到台积电宣布支持云中的EDA,许多芯片制造商才开始认真考虑基于云的设计。

英特尔云业务发展副总裁Mahesh Turaga表示:“一旦关键的晶圆代工厂开始支持云计算,我们就开始看到EDA行业逐渐发生变化。节奏。“由于云计算已被证明是一个高度安全的环境,安全作为一个整体也变得不那么令人担忧。虽然云的采用是由EDA领域的初创企业、中小型企业和其他领域的企业主导的,但大型EDA公司的思维也发生了转变,它们正在积极地寻找将许多EDA工作流程转移到云端的方法。”

挥之不去的问题
即使乌云密布,一些犹疑犹存。谷歌的首席工程师兼董事Richard Ho指出,尽管他在自己公司的云上工作的情况很独特,但由于项目的性质,以及围绕它的一些规则和规定,安全性仍然是一个主要问题。

“如果我在自己的数据中心工作——例如,如果我在一家不是谷歌的公司工作——我必须对我的IT安全设置非常有信心,而不是云,这适用于大多数公共云。但在谷歌中,有一群人专注于安全。有一些团队的工作是为所有客户保护云,包括我自己。我更希望有一组专门的人,他们的工作是安全地进行研究和安全工作,寻找零日漏洞,基本上是监控所有不同的开放端口或人们在配置中所做的其他事情,并不断监控。我觉得在云计算中比在内部网络中更安全,在内部网络中我必须依赖我的IT,而且在安全方面工作的人可能比在公共云计算中更少。”

不过,实现这一目标仍面临挑战。Ho解释说,当他加入谷歌时,他认为因为该公司有数据中心,为其芯片设计计算提供基础设施会很简单。“例如,谷歌不喜欢在与Gmail相同的服务器上运行第三方黑盒可执行文件,因此基础设施对我们的芯片设计团队来说是一个问题。我们想到的第一件事就是迁移到云端,所以我们几年来一直在把我们的芯片设计过程迁移到云端,我可以说我们的tpu是在云端设计的。我们使用GCP,也就是我们的云服务。”

云计算提供了几个关键优势,即使对于那些拥有几乎无限的内部部署容量的企业也是如此。

图拉加表示:“随着工艺技术向3nm及以下发展,对计算基础设施的需求将增加多个数量级。”“这就需要更快的大规模计算,而这只有在云端才能实现。公司发现,由于云上的高级高性能服务器的可用性,当前EDA工具的性能提高了一个数量级,工程生产力可以显著提高,同时降低成本和项目时间线。此外,芯片设计团队之间日益增长的全球合作需求,以及对闪电般的创新的需求,说明了为什么大大小小的公司都在认真考虑将芯片设计工作转移到云端。”

其他人也报告了类似的趋势在推动云服务。“客户如今面临的主要问题是,他们想要解决更复杂的问题,比如复杂的方程和复杂的解法,而他们面临着硬件的限制,”微软的产品营销经理托马斯·勒琼(Thomas Lejeune)说有限元分析软件云。“在接受调查的用户中,近75%的人认为问题来自硬件。由于他们的电脑内核数量非常有限,即使他们有世界上最好的软件,如果他们因为硬件限制而无法计算问题,那就没有意义了。”

图2:调查结果显示由于模拟时间的限制增长。来源:Ansys调查,基于对750+ IT经理、工程师和c级高管的采访。

图2:调查结果显示由于模拟时间的限制增长。来源:Ansys调查,基于对750+ IT经理、工程师和c级高管的采访。

Ansys的立场是,通过消除硬件障碍,可以增加仿真。LeJeune表示,为用户管理云是最理想的场景,因为Ansys最了解其求解器,因此可以直接在云中对其进行调优。

与理解何时使用云同样重要的是,理解什么时候不应该使用云,以及应该在云中处理什么,以及应该在内部处理什么。

“当你用完地面上的硬件,而你需要做些什么的时候,就去云端吧,”麻省理工学院研究员鲍勃·莱弗茨(Bob Lefferts)说Synopsys对此。然而,现实世界的答案并不是那么直接。

“问题是如何获得数据,”莱弗茨说。“然后,你还回来的时候再付钱。另一种选择是把所有东西都放在云上,这样你就不用为上下波动付费,但你必须为它在那里付费,这更贵。这是一种权衡,例如,一个巨大的工作量会来又去。如果我在地面上买机器,那是不明智的。但是,如果我必须在接下来的三周内把数据放到那里,只运行这个作业,然后它又会降为零,我就必须把所有的东西都来回传输,所以这是一种权衡。这绝对是弄清楚发生了什么的一个真实部分。幸运或不幸的是,云服务提供商的工作方式是按品脱血液收费,他们并不关心血液来自哪里或谁抽取了血液。他们只会说,‘这是你欠我多少品脱。你不知道它来自哪里,所以整个成本核算一直是一个相当有趣的挑战,而不仅仅是来自云提供商。 It’s also a challenge internally to have those cost controls in place, because we’re not used to paying for hardware. Normally we would say, ‘I need 1,000 cores for three weeks, but we don’t have them.’ Now you can get them, but how are you going to pay for them? The flexibility brings an interesting cost accounting challenge.”

出于这个原因,Ho和他的团队在基础设施上做了很多工作,因为他们看到了完全相同的问题。“你把数据存储在哪里?”你想用多少入口,多少出口?我们设计了我们的系统和基础设施,以保持我们的回购,以及我们在公司网络内的本地区域。我们将数据转移到云端进行处理,我们尽可能不输出太多数据,所以如果你想要输出报告,你就不会从它中输出整个数据库。您可以将其留在云中,也可以删除它并根据需要重新生成。我们花了相当多的时间来思考这个问题,以使我们自己的成本更低。如果你是客户,那么这些都是需要考虑的重要因素。”

不过,对于某些应用来说,这是没有意义的。西蒙·大卫曼,首席执行官治之根据应用程序的不同,如果移动的数据太多,最好将大部分数据保存在一个数据中心。“当我们签入代码时,我们希望在20分钟内知道它是否正确,”他说。“我们不允许人们在所有测试都运行完之前签入代码,这对大多数人来说是不同的。他们检入代码,然后发现一个错误,并被告知这个错误。我们没有。我们建立了自己的方式,只是在云计算中行不通。如果有的话,我们就会使用云,这样就可以节省机器维护和软件更新等费用。”

此外,在将计算转移到云端时,工作流考虑因素变得非常重要。“工程师在云端工作时,他们的工作流程会有一些变化。尽管它是数据中心的扩展,但如果你必须将数据传输到云端,它确实会造成更多的延迟,所以你必须将其纳入工作流程,让人们习惯它,并为此进行培训。这些是一些实际的细节,随着迁移到云计算而发生变化,”Ho解释道。

AMD的研究员Eric chester说,当他接触云计算时,首先想到的是计算节点。“这就是我们打造的东西,也是我们试图推销的东西,但很快,这句咒语就变成了,‘一切都是关于数据,理解这些数据,’”他说。“特别是对于已经在prem上构建或运行了20年的流,他们认为自己可以立即访问整个数据中心中的任何数据。因此,即使只是确定一项工作是什么,实际上是从什么数据提取的,从哪个文件系统检索数据的工具,一个特定任务使用的是什么,也有很多挑战,包括理解向上移动什么,如何管理它,生命周期是什么,向后拉什么。这些问题有很多答案。对于VCS的一些工作流程,或者模拟工作流程,其中一些是非常可行的,因为我们将模型推到云端,我们运行测试,有些是在批量回归模式下运行,我们在位置上获得通过/失败,并且签名可能是非常少量的数据,因为任何故障的调试都是离线完成的,波形将通过重新运行等来收集。但接下来你就有了覆盖信息的问题。如果我在收集保险,保险的寿命是多少?我如何组合这些,如果我仍然在prem上运行,这些东西的合并?所以数据确实是我们最初花费最多时间思考的事情,从长远来看,我们开始考虑成本优化和用户体验优化。 Where’s that data coming from, where’s it going to, how is it being held? That’s going to be what we’re talking about for the next few years.”

在用户群体大规模迁移到云之前,还有许多问题需要解决。

Cadence的图拉加指出,客户对将芯片设计转移到云端的想法有不同的反应。“一些公司有非常雄心勃勃的目标,要将大部分EDA工作负载转移到云端,并减少内部计算占用,以利用最新、最好的可用云计算技术,提高工程生产力,降低成本,加快上市时间。其他人则采取慎重的态度。总的来说,初创企业和中小型客户的趋势是尽可能地转移到云计算。在将具有几乎无限计算能力的预置客户迁移到云端方面,该行业仍有工作要做。推动这些客户决定利用云计算的可扩展性的关键因素将是短期需求许可的可负担性、基于云计算的服务器性能的显著进步以及云计算上新许可模型的可用性。”

SiFive工程副总裁梅根·瓦克斯(Megan Wachs)建议,在云中的EDA被广泛采用之前,接下来要做的就是增强客户的信心。“为了给客户信心,使用云和行业标准工具,让客户通过云访问机器是正确的方式。我们不一定想要自己的网络服务器,在那里托管我们自己的东西,因为我们站在所有技术的肩膀上,这些技术是由公司提供安全和这些平台的。我们可以把我们有趣和相关的芯片设计放在上面,而不必雇佣整个团队来做安全工作。如果我是客户,我会更有信心知道我们正在使用真正的云提供商,而不是雇佣我们自己的团队来做这类事情。另一方面,作为技术库等的消费者,当我们想做自己的性能分析时,到目前为止,我们通常是通过自己的On -prem或在服务器中,或不在云中的东西来完成的。”

为云端eda付费
授权又增加了一系列其他问题,目前还没有人明确地解决这个问题。

Aldec例如,微软已经在AWS上发布了多fpga分区软件,以便找出最有效的方法。该公司计划在未来的某个时候提供其模拟工具,但由于工具的尺寸,预计这需要一段时间。

Aldec的市场总监Louie De Luna说:“我们通过按月计费的许可证简化了这一过程。“我们正从这个开始。这并不容易。我们需要用户在价格合理的情况下开始付费。没有专门的定价。用户仍然需要为他们在AWS上使用的硬件付费。我们之所以这么简单,是因为当我们试图向用户解释不同的定价选项时,对他们来说没有意义。他们仍然习惯于专业或以时间为基础。所以我们给了他们一个试用软件的路径。对于AWS来说,这仍然是一种“自带许可证”的模式。 Basically the customers purchase the license from us and install it there.”

其他公司也在朝这个方向发展。“对于初创公司来说,这是件好事,因为他们不需要所有的基础设施,”Zdenek Prikryl说,Codasip的首席技术官。“对他们来说,挑战在于确定所有不同选项的范围。这也可以加速采用,因为如果你在云中有一些东西,就很容易访问它。例如,我们希望看到更多的大学采用云计算,而云计算就是一个很好的选择,因为你可以添加任何你想要的学生。你必须管理基础设施,但无论如何,你必须这样做。这不仅仅是在EDA或工具方面。这也发生在硬件方面的fpga云。这将为EDA带来新的商业模式,即用即付。”

这是度量设计自动化所采用的方法。Metrics Design Automation执行董事长乔•科斯特洛(Joe Costello)表示:“对于这种按分钟计费的模式,有两件事需要记住。“这是一个缓慢的过程。你需要一段时间才能最终获得收益,因为人们在不断积累。你不会获得巨大的前期许可费。但一旦你开始行动,它就变得不可思议地可预测和可持续。比起现在,人们花更少的钱去体验同样的模拟游戏。这是这里的关键词。对于同样数量的模拟游戏,他们支付的费用更少,因为他们并不是每天24小时都在使用游戏。”

Hagai Arbel,首席执行官Vtool表示同意。“为什么不按使用次数付费呢?无论使用的是实际使用的几分钟还是实际的操作,也许它可以与您读取的日志有多少兆字节或千兆字节联系起来。也许它可以是工具本身的某种用途。无论采用何种方式,在云中授权EDA工具肯定有比每年的浮动许可更有效的方法。例如,如果你着眼于模拟器等工具,你便会发现它们都是典型的按分钟付费模式。为什么我要每年购买X个模拟许可证,而不是按使用量付费,这样当我需要运行回归时,我需要的不是一个许可证,而是2000个许可证,但我只需要使用一个小时,为什么不启用它呢?”

此外,Arbel相信基于云的EDA将为工具提供商提供更好的利润。“我很乐意向任何愿意启用它的人支付我们总使用量的相当一部分。为什么他们不能转卖?为什么我不能转卖别的东西?为什么我们不能使用一些通用的基础设施,比如云来完成所有这些呢?像谷歌这样的公司,很久以前就证明了这一点。他们知道,如果存在价值,那么商业模式也会存在。当你提供正确的平台,当你允许创新主导,你将从一家销售技术的商业公司中受益——不仅是初创公司,还有大型EDA供应商。”

结论
日益增长的复杂性产生了许多问题,但并不是所有问题都需要在同一时刻得到解决。这是云计算方法越来越受欢迎的关键原因。

Ansys的勒琼说,对电子产品用户来说,真正重要的一个功能是,只有在需要时才能请求云计算。“当你需要峰值计算能力时,你将拥有最佳配置,当工作负载不需要全部能力时,你将能够减少机器和核心类型,因此最终你可以微调成本/性能比。速度快是好事,但如果代价太高,那就不好了。如果我们看看云计算的好处,它增加了模拟吞吐量,而只需要为所使用的硬件和软件付费。这是一个改变费用的好方法,从资本支出转移到运营支出。为此,我们有一些关于投资回报率和总拥有成本的指标。最后,对于我们的用户来说,最重要的是关注工程,而不是维护集群和执行IT任务。这是一种把注意力集中在重要事情上的方法。”

或者正如Vtool的阿贝尔所言,“世界正在走向云端。EDA也必须去那里。”

-Ed Sperling对本文也有贡献。



留下回复


(注:此名称将公开显示)

Baidu