中文 英语
18lickc新利
的意见

在片上网络开发中尽早考虑半导体实现方面

实现如何从根本上影响架构。

受欢迎程度

正如他们所说,虽然历史可能不会重演,但它肯定是押韵的。

2015年,我写了博客为什么实现对系统设计和软件很重要“当时,我想,虽然抽象在系统设计中是必不可少的,但它也有用户必须考虑的局限性。关键的决策,例如那些关于功率和性能的决策,需要比抽象的更精确。但要达到这种提高的准确性需要时间。考虑到更准确地对半导体技术建模时看到的实现效果,基于rtl仿真驱动的功率分析将提供更准确的功率预测。

快进8年,我面临着一个与之押韵的情况。这一次是关于片上网络(noc)的拓扑发展,以及半导体实现效应如何从根本上影响架构。

考虑下面的高级流程图。从白板上,开发人员将从互连中分离出计算和外围构件。用户决定AMBA 5 ACE-Lite、AXI、AHB、APB、OCP或PIF等协议,NoC通常取决于要开发的系统芯片(SoC)中的处理器。

片上网络体系结构及其布局的协同优化

对于互连实现,我们在Arteris提供用于开发和优化NoC拓扑结构的工具和基础设施,即交换机、缓冲区和安全特性的数量,所有这些都基于接口、流量、时钟和电源域规范。在“功能性能”级别,我们和合作伙伴的性能探索工具允许评估内存和其他架构效果。

从这里开始。对吧?那太好了。

从RTL到实现

地点和路线(P&R)以及半导体技术具体实施的影响需要公平的发言权。以下是三个区域,其中楼层规划,有时甚至是P&R之后的实际布局,都会严重影响NoC拓扑开发。

首先,虽然重要构建块之间的互连通常成为帐篷中的长杆,称为定时关闭,但它的硅不动产通常取决于系统中的主要构建块。从以noc为中心的角度来看,我们称之为“阻塞”。设计师要求NoC使用剩下的东西。

其次,这些阻塞与计算和外围组件的布局构建块的端口一起确定通过NoC通信的关键连接的布局位置。用NoC把他们联系起来就像一个谜题。

第三,信号传播成为一个问题,现在我们有了端口位置和可供NoC使用的硅区域。确定信号传播变得非常复杂,特别是在较小的几何节点上,如下图所示:

传输延迟是许多参数的函数,包括实际的代工厂、使用的路由堆栈、驱动单元的类型、使用的过程、电压、温度等等。是的,开发人员仍然使用经验法则,即在大约500ps的时间内可以获得大约1mm的距离,并且需要适当地放置管道寄存器。但是,这仍然很复杂,而且运输延迟没有一个固定的数字。我的第一个芯片设计的日子已经一去不复返了,当时我们手动计算金属路由层容量,并决定在带出之前反转时钟树。芯片第一次尝试就成功了。它使用了0.8微米技术(嗯哼,800nm)的工艺,我想我们只有一个金属层。相比之下,在今天更小的几何图形中,架构师将很难确定在许多层中使用哪一层来传递哪种类型的信号。

日程影响工具的结果远不是立竿见影的

总之,所有这些都归结为一个实际的信息困境。IP开发工具知道架构拓扑问题。奖惩工具知道所有的执行效果。但正如第一个插图的右侧所示,当深入到各个抽象层时,周转时间会变得越来越长。

下图显示了一个支持布局但手动流程的项目进度。

在前端优化NoC架构很容易需要两到五周的时间。该团队使用一个抽象的平面图来共同优化NoC拓扑结构。他们手动制定约束条件,以引导数字化实施流程和P&R。他们自动将NoC从我们的环境导出到RTL,并进行合成和P&R。但是:他们无法关闭计时,这是他们在5-6天的布局运行后发现的。回到手动重新调整约束来更新管道,甚至是拓扑本身(对其他阻塞的更新也可能需要),他们花了大约10周的时间来完成物理关闭阶段。

到目前为止,应该已经清楚,减少导致回到体系结构阶段的循环数量是至关重要的,这只有在共同优化IP及其布局时才有可能实现。

基于抽象的评估可以挽救

我们在上述问题上的努力可能并不令人惊讶。

首先,团队可以考虑早期甚至后期的平面规划信息进行IP开发。在“为什么SoC中的片上网络IP必须是物理感知的我的同事安迪·南丁格尔最近进一步说明了这一点。到今天为止,我们已经更新了我们的IP开发工具,以从芯片图像、Visio文件或LEF/DEF定义中读取平面图信息。

其次,导入带有NoC需要连接的端口位置的块,允许自动放置NoC拓扑的主要组件。检查。我们实现了这一点。它在项目的第一阶段击败了手工开发的约束。

第三,抽象技术信息,如门延迟和面积,以及电线延迟,允许估计NoC组件的位置和管道的插入比任何人工估计都要更好和更快。它是否与奖惩的某些方面相竞争甚至尝试?绝对不是!我们正在与该领域的所有奖惩供应商合作。这些功能为数字化实施流程提供了一个明显更好的起点,因为它们可以拾取由我们的IP开发工具生成的RTL。

最重要的是,如下图所示,这个更好的起点可以大大减少日程安排,因为我们现在允许NoC IP与布局共同优化。

此外,通过优化布线和管道级,这种物理感知流进一步减少了NoC的面积和功耗。我们只是在避免过度配置,这通常是更多手工流程的结果。

这些功能的引入是向前迈出的重要一步FlexNoC 5从Arteris。但是请知道,我们还没有结束!查看最后一个示例,可以快速确定进一步优化的领域,例如与我们可以从合作伙伴的P&R引擎中获得的信息进行更紧密的集成。NoC拓扑结构发展的早期阶段也已经成熟,可以进一步优化。注意这个空间!



1评论

埃里克·埃 说:

弗兰克,就我所知,0.8um是2金属层技术。1983年,MHS完成了2um的大跳跃(从1个金属层到2个金属层),这并不容易(花了一年时间来管理适当的金属线交叉)。

留下回复


(注:此名称将公开显示)

Baidu