中文 英语

选择CCIX和CXL之间

专家在餐桌上,第2部分:什么是正确的一个设计可能不是正确的未来。这是为什么。

受欢迎程度

半导体工程坐下来讨论的优点和缺点,计算表达链接(CXL)和缓存相干互连加速器(CCIX与库尔特·舒勒),负责营销的副总裁Arteris IP;理查德•所罗门串行总线控制器IP技术营销经理Synopsys对此;首席执行官和Jitendra Mohan Astera实验室。以下是摘录的谈话。本文的第一部分,点击在这里

SE: CCIX的优点之一是,它可以让你更容易异构组件连接在一起,对吗?

舒勒是的,它连接逻辑硬件。

所罗门:人们不想让他们所有的硅从相同的供应商。一致性协议并不是新的。我们已经几十年了。他们总是关闭。任何品牌的CPU,它有自己的一致性协议和多包自己的连贯的互连,multi-socket。这里不同的是现在开放。就像乐高玩具,允许您连接这些事情。

SE:那么,你遇到的主要挑战是一些当你创建一个设计和你现在CCIX或CXL工作吗?

所罗门:人们考虑的第一件事就是他们是否需要一个连贯的互连。我们有大量的人来找我们说,‘CXL是热的。我们如何设计?“我们问什么应用程序。如果是基本块存储,你不需要一个连贯的。所以第一个真正的障碍应该在架构上,“你需要一个连贯的互连吗?然后,如果你需要看,你需要CCIX提供的对称。如果你这样做,你的困。CXL根本上是不对称的。你不会去做CXL如果你的设计和系统实现取决于一个对称的连贯的互连。如果非对称互连是好的,那么你可以看看是否延迟是重要的,谁是合作伙伴可以在系统空间。 I tend to look at things from the device side, because the bulk of the designs in the market. There are fewer server and host implementers than there are device-added implementers. So those guys need to look at who they’ve partnered with. If you’re going to use an x86 processor, at least today, you’re probably only going to get CXL on that device. If you’re going to use a different architecture, then maybe CCIX is an option. After that, you’re in to the details of the coherency protocol, and this is not as simple as going from PCI to PCI Express. It’s not a straightforward transition, and you had better be aware of what it means to be coherent. And that leads to power management of the whole system and all the different signaling that has to occur.

舒勒的第一个问题是如何这样做。是你的体系结构对称或不呢?你控制芯片吗?你们在开发芯片?或者你想象你会迷上了从Xilinx还是别人?接下来的问题是,你要你的体育。一切都有一个标准,但是他们都有不同的功能和集成的方法。

Jitendra:还有一个关键的挑战时分发高数据率信号在系统。CXL数据率32 gbps,很快将64 gbps,信号无法到达很远的信号损失预算允许的标准。例如,一旦我们占信号丢失的CPU和终点包,我们只能船舶32 gbps信号4英寸FR-4材料。即使这样,一个作为PCIe Gen-5 x16链接操作标准指定的损失限制每秒钟会有一点错误。所以我们需要一个解决方案,它可以恢复信号,大大提高误比特率,允许CPU可靠地到达最远的作为PCIe插槽服务器或NVMe驱动器。幸运的是,作为PCIe标准定义了一个调整时间类的产品应对这一挑战。缓存时像CXL连贯接口,通过调整时间很低延迟的关键组件。注意,通过调整时间链接一次往返需要2 x retimer延迟。调整时间供应商开始应对这些挑战。

SE:人们一直在关注非对称数据流了很长时间,但这并不是总是那么容易实现。有很多选择呆在一个芯片上,离开到另一个地方,是否一致性是必要的。互连协议如何影响?

舒勒:当CCIX第一次出来,有很多讨论做大规模,对称cache-coherent系统。但当您添加在死亡或单独的芯片中,你必须增加记忆和缓存,数据发生了什么在不同的死,和本地存储,有一个建筑线,它没有多大意义了。你真的失去你获得多吗?架构师是非常难以找出驼峰。即使你有20年的经验作为一个cache-coherent架构师,你不能算出来了在你的脑海中或通过使用Excel。这并不与CCIX CXL工作。

所罗门:当你用这种不对称的数据流,整个系统数据分布是不均匀的,那么很容易依赖一个对称的一致性协议,假设解决它。每个人都有一个缓存,每个人都是平等的。但也容易在一棵树上吊死。假设你选择CXL。这是不对称的,但它有低延迟和广泛采用。但如果你不了解系统架构,您可以做一些非常糟糕的决定。同时,对称的相干本质上是更复杂的。没有简单的答案。这绝对是权衡。艾城人挣扎,因为他们正在构建这些很酷的,大规模并行处理的元素,和他们说,“你可以这样做或者你可以这样做。“问题是,你需要对称多处理和对称的一致性,但你不想要,开销。 So the hardware guys are running around in circles.

SE:现在你有了这些非常复杂的人工智能芯片,突然有多个元素可以使用不同,年龄不同,使用的时间更长比他们用于在过去。只选择移动速度最慢的元素在此系统中,或者最好是设置它,这样每一个功能或多或少的独立?

所罗门:这是一个软件问题。如果我有这些异质元素固有的不对称功能,使用它们的最好办法是什么?这取决于这个问题。如果我在看一个监控摄像头,也许我的问题是找到所有的第一部分的脸。我可能不需要最尖端的设备,所以我想师我的系统,把低能力设备接近相机。每天12个小时,没有人走过,我可以把其余的计算元素关闭。但是芯片设计师并不是挑选。这是系统设计师和软件设计师。

舒勒:发生的一件事当你开始与这些multi-die设计你需要处理的物理效果。很高兴如果你堆栈不同的东西在一个包中,但在市场汽车必须处理温度和振动和如何在这些死亡和散热均匀衬底。这是一个巨大的挑战。如果你有一个ADAS系统,摄像机是在所有时间。他们变得更聪明。摄像机有硅,他们正在做一些推论和对象识别。物体识别是将数据转化为某种形式的元数据,也就是中央大脑。但这东西正在运行,这影响他们所做的平面图上芯片和地方什么。从数字逻辑的角度来看它看起来可能不正确,但热火上下不得消散,因为它下面有一个内存芯片或另一个死在上面。

Jitendra你带来了一个很好的观点。这些服务器系统越来越复杂的设计,建造和维护。缩短设计周期,服务器设计需要灵活地快速和无缝升级从创4 CXL创5。与此同时,云客户激光聚焦于正常运行时间。可靠性、可用性和可服务性是现代系统的关键。半导体芯片用于现代数据中心需要专用的,不仅提供性能和可靠性高,而且易于使用和智能诊断功能。

相关的
哪种芯片互连协议更好?
专家在餐桌上:CXL和CCIX是不同的,但它并不总是清楚这是最好的选择。
CXL与CCIX
相比之下如何计算表达链接缓存相干互连的加速器。
新CXL标准
计算表达链接标准,为什么它是重要的AI /毫升的高带宽应用,它是从哪里来的,以及如何将其应用在当前和未来的设计。
CXLCCIX知识中心
头条新闻、白皮书、视频和博客CXL和CCIX



留下一个回复


(注意:这个名字会显示公开)

Baidu