gpu可以加快EDA算法

老了,连续的EDA算法不能跟上设计复杂性。新的架构正在探索。

受欢迎程度

旧的顺序EDA算法不能跟上增加设计复杂度,这是推动行业看并行性和其他计算架构等图形处理单元(GPU)。

10或20 x门电路级模拟的加速意味着一个测试运行的今天在一周内将运行在不到一天,今天和一个测试运行在一个月内将在几天内运行。

“这减少仿真运行时产生重大影响的整体上市时间硅产品,“说斯Kodiyalam, ISV (HPC)应用程序经理英伟达。“在某些情况下,它使您能够运行门电路级模拟大型和复杂的设计,否则是不可能的或不可行。也提高了产品的质量,允许更大范围的复杂设计,以及为半导体公司节省成本通过启用软件加速器”。

因此,为解决某些EDA任务问题gpu可以理想。因为EDA数据集太大,适合缓存和EDA应用程序的访问模式是随机的,内存带宽成为瓶颈。“gpu是非常适合方式来表述数据并行处理算法与巨大的数据集,因为它们提供内存带宽和浮点性能的几个因素比最新的cpu,”他说。

例如,开普勒NVIDIA gpu有几千个处理核心组织在SIMD组,允许工程师推出几百万短暂的独立线程不需要相互沟通,他说。”而不是优化延迟的单线程,优化吞吐量数量的线程,可以在特定的时间进行处理。”

一种范式转移
gpu是一个范式转变,给工程师机会退后一步,而不是说,“我们如何映射到该算法的这种全新的架构?它并不符合很好,”高级解决方案架构师约翰•克罗伊说节奏。“如果你后退一步,问,“你能重新设计算法仍然从根本上解决同样的问题,但用不同的方式呢?我一直认为迈出一大步,你必须有一个革命性的方法不是一个进化方法。进化让你10%到20%;革命将给你5 x 10倍。gpu最酷的地方是他们让你从不同的角度看问题,试图不压配合一个算法到一个新的架构,而是研究架构和说,‘我怎么利用呢?什么类型的算法确实跑得好吗?”如果你后退一步,从开箱即用的工作,在回到基本面,有时你找到新的方法来解决一个问题,你从未想过的。”

它很重要
从gpu会如何影响的角度设计和制造之间的空间,胡安·雷伊的高级主管工程的口径导师图形指出,EDA / CAD算法的类型,他最关心的是那些用于设计和制造之间的接口。他们主要处理布局,创建生成面具发送半导体的设计。

“有大量不同类型的基础设施需要运行软件在这方面如果软件是用于设计目的和使用的半导体制造地板,”雷说。“即使算法需要常见,因为两者之间应该有一个共同的语言社区,需求是非常不同的。基本设计社会需要验证工作。并把它在一般情况下,广义上讲,该半导体制造工厂需要确保设计会有很好的收益。”

这本身会产生很大的区别两种操作模式的几十几百个内核通常用于一个非常大的芯片的验证在设计方面,相比之下,在半导体制造的地板上使用的硬件,几千个核。另一个比较是设计师往往工作站或服务器,而半导体制造地板需要集群的服务器来运行应用程序。

导师一直在确保其软件在月初以来高度并行的方式工作,因为过渡开始发生超过10年前,雷伊说。“首先需要多线程软件,这样它可以在共享内存处理器工作。然后它必须成为分布式工作在分布式系统上。在某种程度上我们甚至不得不注意硬件加速技术来满足半导体制造需求。发生在几年前,当我们要做硬件加速使用细胞处理器上的集群的分布式x86-type架构。”

但后来发生的事情是,通用多核和开始使用的许多核心架构,硬件和软件社区赶上通用计算程序。它不再需要做很多具体的硬件加速来满足客户的需求。

不过,公司不断进行研究和调查所有的算法,雷伊的压力。“我们看到有信封的成本和权力运行这些系统。出于这个原因,我们一直在调查gpu很多年了。事实上,我们开始调查GPU使用量同时我们开始调查细胞处理器。几年前在某种程度上,我们决定使用Cell处理器,但我们关注(gpu),继续做研究的应用程序运行在gpu。我们保持良好的水平的关注GPU社区在哪里。”

本着这一精神,他指出,虽然有天生适合的算法得到加速度gpgpu(通用计算图形处理单元),EDA社会需要很多注意的总百分比计算,算法需要相比需要运行的完整的应用程序。”举个例子与此相关的,在某些情况下仿真组件可能需要总额的80%计算,是必需的,和更容易端口到GPU比剩下的20%。当你在这样的情况下,你知道最大4 x 5 x加速在完整的系统。”

第二个方面注意是否足以证明客户制作所需的IT投资支持这种类型的硬件系统,把它投入生产,得到的支持需要执行的活动。雷伊承认这不是很清楚的东西,这取决于每个活动的特质。在某些情况下它可能是,在其他情况下可能不合理的投资。“基本上,剩余20%的算法不容易港口到GPU或加速到GPU可能能够证明的一个主要障碍总周转时间是必需的。”

克罗伊补充说,更可以用在GPU上的你会更好,但GPU有几个基本限制。”一个是它没有同样的缓存,CPU,还有某些代码,本质上是标量…这是绝对错误的小问题的工具。但如果你把一个CPU到GPU的串行的部分代码,你不能使平行,并与相同类型的您把缓存什么的,我们今天在我们正常的微处理器,可以消除大量的数据传输,真的杀死了GPU的性能。”

有趣的是,Kodiyalam指出,EDA工具,如RocketSim或风投解决Verilog / System-Verilog模拟器的瓶颈挑战卸载最耗时的计算一个超高速基于gpu的引擎。“在这个混合计算模型,GPU作为加速器的CPU将CPU和提高计算效率。为了利用这个混合计算模型和大规模并行GPU体系结构、应用软件需要重新设计。”

他补充说,RocketickSynopsys对此工程师和NVIDIA工程师一直在一起工作在过去的几年中利用gpu加速的RTL和门电路级模拟各自的EDA工具。熟悉这些工具工作在模拟器环境和运行与现有testbench,消除一定的准备时间,同时提供bit-precise结果。



1评论

[…]一天结束的时候,考虑到今天的EDA算法是精疲力竭了,这个行业最终会达到一个转折点,需要接受新的[…]

留下一个回复


(注意:这个名字会显示公开)

Baidu