创造更好的模型软件和硬件验证

专家在餐桌上:反思方法更复杂的系统,开设个人储蓄账户,chiplets。

受欢迎程度

半导体工程坐下来讨论未来的验证和丹尼尔Schostak,手臂的架构师和验证;硬件工程副总裁泰Garibay神话;在戴尔EMC Balachandran Rajendran,首席技术官;萨阿德Godil Nvidia的应用深度学习研究主管;高级主管Nasr Ullah SiFive性能架构。以下是摘录的谈话。可以找到这个谈话的一部分在这里。第二部分是在这里

SE:我们过去一直严重依赖模型。我们可以通过与相同种类的模型在未来,还是我们不得不开始重新思考一切吗?

Garibay:对于chiplets,每个人都必须在相同的页面上。他们都是可互操作的。在这个行业,我不知道有任何商人来自不同供应商的产品硅chiplet-ish类型的包,其他比HBM内存。这是一种商业问题。我们从来没有解决的问题,如果集成包失败,谁支付它。缺乏某种形式的签字是一个互连的IP供应商的机会和EDA公司介入,成为某种形式的诚实的经纪人说,“好吧,我日志接口,验证一些贵宾服务,并可用于其他公司。”这是一个第三方的机会谁能验证这两个东西应该一起工作。整个责任问题,真正约束的市场chiplets直到现在。我已经试了三次这样的离开地面,跟其他公司。每个人都很兴奋,直到业务人员和律师参与说,“那么,你打算如何解决这个问题呢?“这是一个真正的问题。出现了一个级别,我们的模型,我们必须找出如何定义这些模型以同样的方式我们已经好几代了。有可能大开放形式验证,能够说所有这些chiplet接口必须正式可核查。和一些EDA公司做正式介入,可以说,“是的,我们在这里。”

Ullah:我非常喜欢模拟。然而,还是太贵了。花费数十万美元。我们在先前的公司取得了很大的进步,我们必须构建并运行Android软件一堆与Java应用程序——包括包括的东西,以确保工作的事情。这是一个广泛的软件,很难做一个纯粹的功能基础。所以我是一个大风扇的功能模型或性能模型在混合的情况下,我们使用导师与RTL的仿真平台,是非常成功的,来自专业芯片,然后与第三方合作,确保操作系统引导——Linux或Android。然后我们在软件运行。这对性能非常成功,权力和功能。我们需要利用这种混合模型很多,我们可以专注于功能性性能,这些事的RTL,混合和匹配。但并不是每个公司都能买得起一个模拟器和设置所有这一切。 So if the companies can work out some method like Amazon does, where you can get time on emulator to put your system in and mix it up with your software, that is where we have to go for the future.

Godil:模拟这样一个改变游戏规则的时候验证方法。能够使用您的软件套件作为测试平台是强大的,特别是当我们建造更多和更复杂的芯片。有一个有趣的搭配与新功能的模型作为我们建立新的芯片。能够利用软件对他们来说是至关重要的。软件团队需要去开发他们的软件,因此,一旦准备好你的硬件,软件准备好了。有一种依赖,一种方法去除depenency是为软件团队提供更高级的模型,他们可以开发他们的软件。有不同层次的模型。功能模型可能有很多细节,但软件团队不需要那样的忠诚。有较低的忠诚模型,速度快得多,和软件的团队能做的所有的这些发展。我们将会看到更多的使软件左移位,所以一旦我们可以在模拟器平台上可以运行软件和有准备的目标新特性。

SE:这些模型有什么不同呢?

Godil:每个模型,构建有一个很大的成本。有人去构建它,然后你必须维护它,所以你必须非常小心在发现什么是价值,交易成本。有很多有价值的发展中更新模型,可以把软件,我们将看到更多的我们前进。当你建立越来越多的硬件特性,需要有针对性的软件,软件团队将需要某种平台的开发设计之前准备好。功能模型有时时间过长,特别是高保真功能模型。有很多变化,因此你不能真正建立功能模型过于超前的设计。有所有这些代码开发方面。但软件团队并不真正关心这些细节。他们需要一个更高级的,如果你愿意的话——一个ISA模拟器,如果你考虑处理器。你有这些ISA模拟器开发早期,没有任何的微体系结构细节或者很多功能其他团队关心的细节。你会看到,SoC。我们要借处理器发展这些概念,你可以把它应用到其他硬件设计,。

Ullah:从处理器的工作模式,我同意我们需要一个高级ISA模型软件开发。我们还需要一个高保真的功能模型进行验证更准确地说,我们需要一个低保真cycle-approximate模型,也许功能基于表格的时机,然后一个高保真的性能模型,cycle-approximate模型、微体系结构工作。然后这些应该能够领带RTLSystemC或其他模型,混合的方式。

Godil:我主张的是低保真模型快,像ISA模拟器,但剩下的设计。这就是现在失踪。那么多的软件硬件设计现在暴露出事情,和软件团队真的需要一些能够去目标这些特性。模拟器并不新鲜。我们知道知道如何构建它们。我们没有这样的一个抽象级别的模型可用于我们的硬件芯片。我们将会看到越来越多的,当你试图把在软件进行测试。

Schostak:一个正式的事情迫使人们实际上做的是更多的思考如何定义接口和一切。模拟和仿真,它太容易说,‘这RTL是不够好。我现在打算运行一些测试,看看它是否能够工作。如果成功的话,这很好。“我并不是说这是标准的做法。但这是一个很容易落入的陷阱,而正式的工具肯定会告诉你如果有事情不完全在你的规格。为定义良好的接口,它提供了一个很好的机会交流跨边界模型内部。我们已经讨论过的上市时间。你提出的RTL时间表。然后,窗口你有来构建模型,而它仍然有用萎缩下来,因为你没有RTL可以在模拟器中运行。 If I’ve got a high-level specification of what I’m going to build, what can I actually generate from a high-level specification that might be able to generate some aspects of my ISA model? That will give that person a head start, as well.

Garibay:人人都在谈论的很多东西很处理器或SoC-centric。在人工智能芯片C模型。但是为了做一个完整的图像分析,图像和一个需要teraOps C模型。这是其中一个原因我相信真正的人工智能芯片的验证是不同的,更具有挑战性。如果你要验证水平你揭露每个繁殖和每个添加、操作的数量是如此之大,在Verilog,我们甚至不能做一个一个图像在合理的时间内。所以你了说,‘好吧,让我把这个角落。“没有一个模拟器,我们会死。我们不能,不能发展我们的编译器。

SE:在过去,当我们在发展中advanced-node芯片,他们大多是进入消费设备或服务器。现在的一些最先进的设计汽车和机器人,他们应该工作了十多年。从验证的角度看能做些什么使这一切成为可能?验证将左右吗?

Garibay:安全历来都认为更多的架构,然后体系结构定义了测试,可用于验证。我不兴奋骑在基于5 nm或驾驶汽车。这是超级有趣的功能安全的一面。它真的力量分解。你必须打破一切”,这是安全的一部分,这部分是不安全的,这是它们之间的接口。这就是我如何判断这些事情。对人工智能的,然后,没有功能安全的定义。你怎么判断是72%准确,功能安全吗?一些厂商正在实施一个计划,他们有一个处理器从公司和一个处理器公司B,并行地运行它们,你投票了。就像航空电子设备,有一个投票系统中三个结果。这是一个巨大的,巨大的开放空间,甚至还不清楚如何结构等这些问题可核查的,或适合的技术验证。 And it’s constraining how we move forward with it.

Godil如果你的工作ISO 26262标准,很快变得明显的一件事是需要记录每一步的验证流程。每次我听到文档我觉得开销。更多的官僚主义,工程师必须处理。但是我希望我们可以构建工具消除这种开销,我积极一点。我们投资于记录越多,它越会帮助对方,我们希望仪器流程的数据我们可以喂它和列车智能系统。形式化过程和记录每一个步骤,我们将我们这个方向。我认为功能安全协助工作。它非常符合需要的东西。但是我们需要更好的工具来帮助消除大量的开销,这些功能安全流对团队。

Schostak:功能安全,有文档开销。如果一个错误逃到野外,你不能修复的硬件。硬件已经将已经通过了功能安全认证过程,等等,需要好几年的时间。所以你不能依靠bug被发现在现场。它不像你可以在一年之内re-spin并修复它。这不是那么简单。它仍将需要几年的研究发现硬件和软件上运行它。部队一个更高层次的保证没有任何会影响重要功能关键安全或安全系统,这通常是标准的ECC或冗余设备之类的东西。

Ullah:更好的工具是很重要的,但实际上这取决于测试,测试,测试。我曾在88100年摩托罗拉的风险,在爱国者导弹鼻锥,每次一个爱国者导弹错过了飞毛腿在伊拉克战争期间我想知道如果是我写一些软件。从摩托罗拉F18有88110。当一个F18崩溃,我们必须找出原因。原因是一个嵌套中断控制器。我已经调试。

Rajendran:我们不谈论的一个挑战从工具的观点是,他们都是与ISA标准不断变化,有新添加的东西。但从组织的角度来看,组织本身并不存在。他们没有框架和其他实例,所以如果发现缺陷产品15年后,他们不能模拟它,并说这是一个错误。没有方法。我仍然可以使用Synopsys对此或节奏的工具我用15年前吗?如果我有问题还会支持吗?这些都是悬而未决的问题。所有我做的验证,现在我必须保留15年的数据。有数据组织内爆炸。一些组织正在考虑调查这件事,但是此时其他人仍然一无所知。 They’re focusing on the design part of it, but they’re not looking at what they’re going to do if a chip comes back.



1评论

彼得·C鲑鱼 说:

我不是一个测试的专业,所以我的想法可能是有缺陷的。然而,在阅读上面的评论,我认为以下是有意义的。系统中提供了一个小测试芯片。建立系统上运行应用程序软件,试图行使所有的功能。捕获行为监控一个或多个系统公共汽车、抽样程序中只有在战略点。测试多个系统和比较结果找到一个“已知的好的系统”。商店的行为良好的系统称为测试向量。软件要做到这一点应该不到建模方法。随着时间的推移持续监控的公交车。发生变化时,隔离导致的芯片之一,或一段一个芯片的系统。 Maintain a map of good and bad devices, and swap out any newly failed device or segment. This approach is conceptually similar to one that has evolved for flash memories.
这个概念的人吗?

留下一个回复


(注意:这个名字会显示公开)

Baidu