中文 英语

一致性,缓存和可配置性

提高性能的基本原理。

受欢迎程度

一致性是赢得人心大范围的应用程序系统供应商开始利用异构计算来提高性能,减少权力,简化软件开发。

一致性并不是一个新概念,但使其更容易应用一直是一个挑战。这就是为什么它很大程度上是具有相同的处理器内核的cpu。但是现在的方法被应用在更多的地方,从高端数据中心到手机,它被应用在更多的内核更多的设备。

“今天,在网络和服务器空间,我们看到异构处理,”尼尔·帕里斯说,系统和软件组的高级产品经理手臂。“这是真正的混合物,例如,手臂cpu可能大小不同的cpu,但其他处理器DSP引擎等。他们想要缓存的原因归结于效率和性能。你想之间共享数据处理器,然后如果你有硬件缓存,不需要考虑它的软件。它可以很容易地共享数据。”

没有硬件的一致性,必须编写的软件。“所以每次你需要解析一些数据从一个CPU,需要清洁的一个CPU缓存到内存,”帕里斯说。“你必须告诉下一个CPU的如果你有任何旧副本这个缓存中的数据。你必须失效和清洁。然后你可以读取新的数据。你可以想象这需要CPU周期。不必要的内存访问和动态随机存取记忆体权力这样做。所以,硬件一致性是改善系统的性能的基础。”

如何实现,并不是那么简单的,虽然。研究已经进行多年来提高一致性,使它更容易实现。

“我们的世界里,在很多设计团队,团队成长起来的软件硬件团队的整数倍,所以软件开发的成本是非常昂贵的,”乔•罗兰兹说,首席架构师NetSpeed系统。“一致性的解决方案,更多的设备变得连贯。”

过去的唯一真正的调整相干公式是内存访问延迟的变化。所有的代理仍然是相同的和对称的。越来越多的事实表明,情况正在改变。

“现在我们看到的是完全不同的代理,和你的CPU,你可能有一个高性能CPU和一些非常低的电源,低成本的CPU在同一个系统上,这两个需要连贯,”罗兰兹说。“你可能gpu是一致的。gpu是有趣,因为不同的cpu,他们更多的延迟不敏感,但他们有更多的相干带宽。”

这是两个完全不同设备的例子,这一趋势是找出如何让这些东西一起工作。罗兰兹认为硬件联接方案需要理解这些不同的需求,不同的缓存大小、不同数量的端口,基本上每一个地址。

业务发展副总裁Anush莫汉达斯·NetSpeed,强调这是异构计算的本质。“当我开始作为一个设计工程师,整个处理器是一个芯片。没有SoC,所以芯片意味着CPU。现在,芯片意味着很多不同的事情。一些工程团队可能实现16个或20个不同的CPU核进行数学处理,GPU并行处理,DSP核心摄像系统进行图像处理。所有这一切发生的同时,和所有这些不同的需求在系统级需求,电力需求、性能需求,延迟需求,所有的这些需要以一致的方式进行管理。这就是一致性已经爆炸了。”

罗兰兹认为,一个连贯的解决方案必须建立优化的具体系统和特定的组件。“系统CPU将是非常不同的从一个CPU + GPU系统,或者一个CPU + DSP系统,或它们的组合。同样,在知识产权方面,当你正在构建一个单一的、固定的配置一致性IP,固定配置不利用任何的不对称系统。”

气的困惑
这就是连贯的中心接口(CHI)发挥作用,并且是最常见的上下文安巴5气

库尔特·舒勒,负责营销的副总裁Arteris“连贯的中心”,指出,词引起混乱。“传统上,这些东西已经铁板一块,也被称为缓存控制器。问题是,当有一个中心,它基本上是一个大横梁两端逻辑,吨电线在里面,所以地点和路线时间时,它就非常困难。因此,行业要求的东西使他们达到定时关闭,和更容易度过地点和路线。”

,首席技术官超音速表示同意。安巴5气语义上看起来很像安巴4王牌,但身体看起来非常不同,因为它是一种包处理的接口。“它的真正含义是,当你得到一个完整的阿喜或ACE接口,信不信由你,你是8相互依存的价值通道的信号。不是八signals-eight套被在每组可以有成千上万的信号。电线可以很容易地得到1000的总数为128位的接口。”

可以理解的是,开始成为一个集成的障碍,他说。“气他们定义一个接口,你可以把它们看作是多路复用这些渠道在一个共享的接口,但他们实际上比这远一点,它定义而言,看起来更像是一个分组格式。他们的原因是,使大规模缓存相干芯片的设计,这是很快的不仅仅是big.LITTLE。的两件事,有六个或八个集群的连贯的处理器通常一起被推第三级共享缓存,也许等异构加速器gpu,例如。”

Wingard说手臂没想到安巴5中使用非常普遍。在连贯的中间部分的设计有非常详细的沟通的不同组件之间的依赖关系和交互。因此,只定义接口(这就是气)并不能保证真正的系统级别的互操作性。

ARM的帕里斯同意申请的数量远远超出最初预期的一致性现在而是因为硬件一致性的原则来简化软件,删除软件复杂度开销,它适用于很多的地方有一个处理器。

“有足够的系统级属性的所有东西是如何工作的,并且很难捕获所有的接口规范,“Wingard说。“总的来说,人们使用气或这样做在一个封闭的系统模型。要么他们接收处理器和织物组件由手臂或者他们有一个这样的公司架构处理器许可证和他们建立自己的织物。在这两种情况下,它更像是一个封闭的系统模型”。

构建一个互连结构是一个不小的任务,而不是当今主流的做法。行业仍处于一个阶段的工程团队认为,低风险路径接收处理器和织物IP来自同一人有机会co-validate处理所有这些系统问题,Wingard说。这些人详细了解什么与什么在设计。

“每一个互连设计将以不同的方式对它进行优化。手臂和其他供应商将提供大量的配置选项的被许可人可以调优性能和属性互连,以满足他们的需求。手臂是非常大的可配置性,提供了设计工具来帮助合作伙伴优化设计,以满足他们的需求。这可能意味着使它尽可能最小的面积,以满足性能目标。它可以调整频率的目标。有很多不同的地方你可以定制和配置IP来满足产品的需求,”帕里斯说。

定制接口协议本身而言,帕里斯补充说,有很多潜在的陷阱,挑战,和困难。“IP接口标准工作最好当每个人都遵循相同的标准。如果每个人都有相同的接口标准,所有的IP和验证IP插头和玩在一起。如果有人走离这个标准,现在你需要一个特殊的EDA工具或一个特殊的建模解决方案。它变得更昂贵的方式。你真的可以受益于做这些修改?也许吧。但将这些好处大于不相容或非标准解决方案的成本和非标准的IP ?”

舒勒说Arteris这个效果最好,当IP完全符合目标市场。当包不适合它可以带来麻烦。

正因为如此,有很多增长发生在这一领域在IP和系统组件单独处理引擎特定的事情,他说。认为视频处理单元或图像信号处理器和并行处理器的机器学习。“这个空间的公司想知道如果他们可以利用缓存,因为他们可以有CPU集群——一个行业标准的CPU,定制,定制的IP -一个共同的记忆,“舒勒说。“帮助与带宽和延迟,尤其是如果你没有出去的DRAM,因为大多数的东西你处理缓存。它也可以帮助简化软件。”

规模较小的一致性是包含在一些很小的设备如飞思卡尔/ NXP公司的64位网络基于arm处理器,帕里斯。“这是一个小芯片与单个集群的核心,和缓存相干互连设计容纳多个CPU在移动应用程序集群,但也发现使用在网络设计、存储控制器设计,机顶盒,汽车。”

展望未来,安巴的未来版本将系统的努力提高效率,提高效率之间移动数据和共享数据的系统中不同的处理器和电线,他补充说。”作为合作伙伴构建越来越大系统随着越来越多的处理器,我们新的互连设计和新CPU的设计,我们可以看到不同的方法来改进的协议。”

虽然有巨大的设计下一代处理器处理的复杂性,甚至更多的通用应用程序处理器的手机和类似设备,Arteris的舒勒得出结论,尽管只有少数公司能够证明下降到10 nm和7海里立刻——至少,他们仍需要出售的产品是低功率,和高性能的设备10 nm和7海里。“你打算怎么做?你需要更有效率的处理您的硬件;你要有更高效的硬件。这意味着你不能够运行所有软件只是在CPU核心。你要做更多的卸载,异质的东西真的是要起飞。”

有关的故事
有多少核心?
扇出和2.5 d将会改变内核执行和怎样使用它们;混合架构演变。
异构多核头痛
使用不同的处理器系统中,功率和性能,但它却使缓存一致性更加困难。
更多的处理器核心更好吗?
一个架构变化的影响在硬件、软件和设计流程有深远的影响。添加第二个处理核心增加了数不清的复杂性。
一对一:迈克穆勒
手臂的首席技术官谈论新的记忆策略;相干与非相干性的设计;未来手机的创新;限制可穿戴电子产品,和堆死的影响。



留下一个回复


(注意:这个名字会显示公开)

Baidu