中文 英语

随着信号速度的增加,重计时器取代重驱动器

随着越来越多的设备通过高速协议连接,驱动程序正在失去动力。

受欢迎程度

由于新的PHY协议对重驱动器的要求太高,重计时器正在经历复兴。

多年来,转接驱动器和定时器都被用于扩展有线信号范围。但由于其相对简单和较低的成本,驱动器在这一领域占据主导地位。这种平衡正在开始改变。

at的IP核总经理马特·琼斯(Matt Jones)说:“重计时器代表了三个没有人希望在他们的系统中出现的东西——面积、成本和对其去向的考虑。Rambus.“然后再考虑到权力,每个人想到的第一件事就是,‘我怎么使用这些东西?’但现实是,它们正成为一种绝对的必需品。”

一些协议总是依赖于重计时器来获得带宽,而其余的协议则可以很好地使用重驱动器。然而,新一代的USB和PCIe已经突破了这一限制。并行转换器通道-特别是那些依赖于新的调制方案,如PAM-4和更高的不再有能力在没有重计时器的情况下驱动足够远。

“有三个主要的SerDes生态系统:USB、PCIe和OIF/802.3,”Kandou标准副总裁Brian Holden解释说。“OIF/802.3以太网世界从来没有进入重新驱动,因为他们一直在推动速度。这个生态系统已经发布56 Gb/s的SerDes很多年了,现在正在开发112 Gb/s的SerDes。USB长期以来一直支持重驱动程序,但USB4正被迫转向重计时器。PCIe也支持在它们的链路中使用重驱动程序,但PCIe 5.0已经基本停止了这一点,而6.0将完全终止它们的使用。”

关于PHY的一切
对更快通信通道的推动使得PHY技术越来越依赖于SerDes的变体,而信号质量的衡量标准是眼图的干净程度。当信号沿着线路传播时,它们的质量会下降,这就产生了到达的概念,即信号在不能再可靠地接收之前可以传播多远。

图1:两级NRZ信号的经典眼图。来源:Andrew D. Zonenberg -自己的作品,CC BY 4.0

图1:两级NRZ信号的经典眼图。来源:Andrew D. Zonenberg -自己的作品,CC BY 4.0

然而,如果有一种方法可以更新信号,使其可以传播得更远——有点像中继器,设计师就可以扩展这种范围。用SerDes的话说,退化表现为闭上眼睛,他们想要一些能让眼睛重新睁开的东西。在实践中,这可能很难做到。

这对于一个基本的两级SerDes信号(所谓的NRZ)来说已经足够困难了,但是新的调制方案像PAM-4, PAM-8,以及更多让它更难。在这些情况下,有多只眼睛,为了恢复数据,所有的眼睛都必须是干净的。

“最简单”的解决方案是缩短痕迹,把东西靠得更近。这通常是很困难的,而且通常是不可能的。对数据中心的研究有助于解释为什么会出现这种情况。

以数据中心为例
数据中心中的机架由用于计算刀片的插槽组成。从历史上看,交换机有一个顶部插槽,用于接收来自刀片的PCIe信号,并将它们路由到其他刀片或其他机架。

这些机架的机械规格是很好的。“当你观察服务器架构时,机架尺寸没有变化,主板尺寸也没有变化,”Jones指出。

这个设置有两个部分需要注意——从CPU或其他计算组件获取信号到I/O所在的单板边缘,然后通过电缆将该信号从I/O传输到其他I/O。

在第一种情况下,信号必须传播的距离是有界的。pcb是标准尺寸,因此虽然CPU和边缘之间的距离可能会有一些变化,但这种变化是有限的。琼斯说:“CPU设置将是中间偏离中心的,以确保你能充分利用风扇溢出来进行额外的冷却。”“你仍然会在电路板的边缘保留I/O和插头。”

在第二种情况下,我们不知道信号会去哪里。它应该会在开关处结束,但是信号来自哪个板是不同的。应该可以在任何槽中放置刀片,所以最坏的情况是板远离交换机。过去的情况是,电路板在底部,开关在顶部。琼斯说:“从货架的顶部到底部,如果没有远远超出预算,你就会处于危险的边缘。”

在一种能够改变这一距离的罕见情况下,开关移动到机架的中间,将最坏情况下的距离大约缩短了一半。“即使在以太网或光学的经典案例中,你也会看到机架交换机的顶部移动到机架的中间,”Jones说。

但除此之外,这是一个固定的架构。考虑到现有基础设施的数量,机械尺寸几乎不可能发生变化。未来唯一可能改变的是频道材料。琼斯说:“随着时间的推移,这种互连的性质将从铜转向光学,以解决这个问题。”

无论带宽增加多少,信号都必须能够成功地穿越这个距离。理想情况下,信号可以在没有任何帮助的情况下从驱动器传递到接收器。这在很多情况下已经不可行了。因此,需要一些清理信号的方法来进一步推动它。

在通信世界中,有两种扩展信号的方法——重驱动器和重计时器。重新驱动更为常见。但是remer并不新鲜,它正在激增。事实上,在许多应用程序中,它们正在取代转驱动器。

重新驱动程序很简单,但也有局限性
重驱动器是一种模拟电路,它只是试图清除信号。它使用均衡来补偿信道如何降低信号,并将信号放大。但它也放大了噪音。虽然它可以减少某些类型的抖动,但它可以添加一些自己的抖动,使其成为一个混合包。

图2:简单驱动程序框图。来源:Kandou

图2:简单驱动程序框图。来源:Kandou

重新驱动程序的放置可能很棘手。虽然把重驱动程序放在通道的正中间很有诱惑力,但信号在那一点上已经被降级了,把它往下推可能会提供更好的性能。

但重驱动程序的性能将取决于从源到目的地的整条线路的性质。在一个固定的系统中,通过数学和仿真可以确定最优的位置。这种模拟不仅要考虑到通道的长度和类型,还要考虑到任何不连续性,比如引脚和插座。

“如果你使用的是重驱动器,你需要知道从一个芯片到另一个芯片的通道,以及中间的通道,”英特尔公司的产品营销经理Priyank Shukla解释道Synopsys对此.“有连接器吗?”连接器是如何布局的?通道的不连续是什么?在开始使用重驱动程序之前,你需要了解系统。”

这在数据中心机架等模块化架构中成为一个问题。在这种情况下,任何板都必须能够驱动任何其他板,而不管谁制造了这些板,谁建造了机架,或者使用了哪些插槽。这使得理论上不可能确定最佳位置。如果这样的机架中的单板使用重驱动程序,那么它可能无法与其他单板正常互操作。

此外,重驱动程序不能对通道质量的任何变化做出反应,因为重驱动程序配置是静态的。

不过,转驱动器的优点是它们简单、经济,而且它们对信号增加的延迟很小。

Retimers:复杂但功能更强
相比之下,重记器并不是简单地试图清除信号。相反,它们会创建一个新的信号副本。Marvell半导体解决方案营销副总裁奈杰尔·阿尔瓦雷斯(Nigel Alvares)说:“要打开眼界,你需要定时器。”“所以你会看到它们随着速度的提高和电压的下降而激增。这是一个关键的构建模块,我们看到越来越多的用例。”

图3:在没有重定向或重定时器的情况下发送和接收信号(左两图)。一个重驱动器(第三个图像)将信号振幅带回,但获取的噪声仍然存在。重计时器(最右边的图像)创建了一个全新的信号,与最初传输的信号相当。来源:Kandou

图3:在没有重定向或重定时器的情况下发送和接收信号(左两图)。一个重驱动器(第三个图像)将信号振幅带回,但获取的噪声仍然存在。重计时器(最右边的图像)创建了一个全新的信号,与最初传输的信号相当。来源:Kandou

这意味着将时钟从信号中提取出来,以获得数据流本身。然后用重新插入的时钟重新序列化该数据流。这是通过特定于协议的方式完成的。因此,虽然重驱动程序可以在任何线路上工作,但PCIe重定时器只能在PCIe线路上使用。

图4:简化重计时器框图。它比重驱动程序要复杂得多。来源:Kandou

图4:简化重计时器框图。它比重驱动程序要复杂得多。来源:Kandou

retimer的“协议感知”可以显著增加信号的延迟。在一个时钟周期内,可以前后推拉信号以消除偏移。但是在这样做的过程中,可能需要从行中取出整个数据包,验证校验和,重新打包数据,然后重新发送。

“使用以太网或任何类似的协议,你不传输单个比特。你可以传输成百上千个比特的数据包,”微软的产品营销经理Todd Westerhoff指出西门子EDA的PCB。

然而,这些转化为时钟周期的方式可能有所不同。“时钟周期并不是估计延迟的好方法,”Kandou的营销总监保罗·威尔逊(Paul Wilson)警告说。“这取决于参考时钟,每个协议和波特率都不同。”

协议感知还允许重计时器针对该协议进行优化。Shukla说:“如果我们专门讨论PCIe,发射器有一个频道的特定旋钮,重计时器知道这些旋钮。”“以太网没有类似的旋钮。这就是为什么PCIe重计时器在以太网生态系统中不起作用。”

协议还可能需要在传入和传出链路上进行链路培训。这使得重计时器的复杂性远远高于重驱动程序。

然而,这种复杂性的好处是输出信号将不仅仅是旧信号的清理版本。这将是一个真正的新信号。损失预算被完全重置,理论上可以无限地重复这一过程。

这在计算链路可靠性时很有帮助,因为每个段都是独立的。“当我在建模和模拟时,我可以将它们视为具有独立故障概率的独立链接,我可以直接进行数学计算,”韦斯特霍夫说。

这与重驱动程序形成对比,重驱动程序永远无法完全恢复质量,因此后续的重驱动程序对于每个额外的下游重驱动程序的效果将较差。而且可靠性必须计算整个连杆,而不仅仅是转驱动器之间的段。

Westerhoff说:“驱动器本质上是模拟信号改进设备。“你可以从模拟的角度对一个信号进行多次增强,然后就会失去它。”

然而,重计时器延迟可能会增加。简单地添加重计时器可以对整体延迟产生重大影响。这对于单向信号来说可能没有太大的区别,但对于双向通道来说,如果不进行管理,累积的往返延迟可能是一个问题。

复杂性也会导致更高的功率,尽管这似乎是协议相关的。“在PCIe的情况下,重定时器的工作负载是相当繁重的,”琼斯指出。舒克拉指出,这意味着每个通道的功率大约是重驱动器的两倍。

另一方面,与USB相比,重驱动器和重计时器具有或多或少相同的功率。Wilson说:“KB8001 (Kandou USB重计时器)在配置为usb3.2模式时的平均功耗为10 Gbps(单车道),与典型的重驱动器解决方案大致相同。”KB8001为324兆瓦,而TI的TUSB1002A为330兆瓦。”

Retimer-cable-retimer
在数据中心板上,在I/O驱动程序之前放置重计时器显然是有益的。这样就能保证最干净的信号离开电路板。但是CPU和边缘之间的距离也成为一个问题,因此使用双重计时器策略,在CPU和边缘重计时器之间使用重计时器。

图5:简化的数据中心示例。在板载信号中间的定时器帮助信号到达I/ o。在I/O之前的定时器确保最干净的信号传到电缆上。接收板边缘的重计器通过清除接收到的信号来最大限度地提高互操作性,而不管它来自哪里。资料来源:Bryon Moyer/Semiconductor Engineering。

图5:简化的数据中心示例。在板载信号中间的定时器帮助信号到达I/ o。在I/O之前的定时器确保最干净的信号传到电缆上。接收板边缘的重计器通过清除接收到的信号来最大限度地提高互操作性,而不管它来自哪里。资料来源:Bryon Moyer/Semiconductor Engineering。

由于中间重计时器的位置并不重要,因此更容易为许多不同的设计或代重新使用现有的电路板布局。如果使用了重驱动程序,那么每个板都可能需要重新优化,这是一个显著的增量开发成本。

琼斯指出:“你可以移动所有这些东西,但这需要重新设计。”“这是金钱和时间——每次都是减速。所以当你从PCIe第4代到第5代,你真的想经历一个完整的主板设计周期吗?”

它还促进了互操作性,因为re计时器并不关心是什么在驱动它们或它们正在驱动什么。Shukla指出:“重计时器给了你这种灵活性,你可以把它放在任何系统中,它都会起作用。”“重计时器会自我调整,并确保不同生态系统供应商之间的互操作性。”

一旦离开棋盘,就不可能在任何地方放置重计时器了。虽然USB有活动电缆,但PCIe没有,所以除了电缆链接的末端,没有地方可以放置重计时器。因此,确保互操作性的典型配置是在任何此类链接的开头(比如在板的边缘)放一个重计时器,然后在接收器处再放一次。

琼斯说:“由于在链路长度上缺乏决定论,你很可能在任何这些安排的发送端和接收端都看到重计时器。”“所以你会说:retimer-cable-retimer。rem计时器会尽可能靠近边缘。”

驱动器因其简单、低成本和低功耗而成为首选。一般来说,即使是现在,如果一个重驱动程序可以工作,那么它将被使用。只是随着速度的增加,这种情况的数量在减少。

维斯特霍夫说:“在重驱动和重计时器之间选择,我总是宁愿选择重驱动。”“它更简单,更便宜,而且不会在系统中插入任何明显的延迟。问题是,当速度足够快,线路足够长时,你就无法继续以足够的余量再生信号,这样你就可以依赖这个链接了。”

舒克拉同意了。“如果我完全了解我的系统,并且我百分百确定使用重驱动器可以确保系统的功能,我就会使用重驱动器,因为这样可以节省电力。但这将是一个封闭的生态系统。我的板子只能用我的组件。重计时器使这个系统100%打开。”

汽车是个例外
一个似乎不欢迎留名者的环境是新型电动汽车.电缆的重量和成本都是一个重要的考虑因素,距离迫使使用更昂贵的屏蔽电缆。

有人可能认为使用定时器可以缩短链路,从而可以使用非屏蔽电缆。但是使用这些计时器将抵消有线电视成本的节省。

更重要的是,每个主动部件都会影响汽车的可靠性——这是由于系统的安全关键性而引起的考虑。根据定义,使用较长的屏蔽电缆比添加定时器更可靠。

使用重计时器可能更容易计算链路可靠性。但这只是其中一个环节的可靠性。汽车方面的担忧涉及到整个汽车的可靠性——这是一个非常不同的计算。

“当你在车里制造一个东西时,你并不是在制造一台PC,”设计IP的营销总监汤姆•王(Tom Wong)说节奏.“每次你引进新的电子产品时,你都必须担心随着时间的推移故障率。因此,如果我必须做一个没有重计时器的设计,而不是重计时器,我宁愿用被动屏蔽电缆来解决这个问题。”

恶劣的道路环境也无济于事。黄说:“如果我在建造一台计算机或网络,我就会在任何时候使用短距离,并添加一个重计时器,这样就可以很好地恢复时钟。”“但是我的计算机数据中心没有摇晃、嘎嘎作响和翻滚,也没有高温。”这样看来,暂存器将不会出现在车辆上。

撇开汽车不谈,通过PCIe和USB连接的巨大增长推动了重计时器的数量。虽然司机们不会很快消失,但随着速度越来越快,他们的日子似乎屈指可数了。



1评论

Tanj 说:

似乎应该有可能让重计时器清理信号的延迟比CRC所需的更少。它能不能通过几个时钟的延迟,重复其对正确波形的最佳猜测,并重新调整转换的时间以及PAM4等协议中的电平?大多数反序列化程序都在FEC和CRC之前做出这样的决定。

是的,错误率会稍微高一些。逻辑上,如果每个重计时器到达的误码率非常小,eps < 1e-6,并且每个重计时器的输出是一个局部有效且正确形成的最佳猜测,那么N个重计时器应该导致N*eps的错误率。

这比重新驱动程序要好得多,而且很可能足够低,以允许端到端恢复协议仍然正确工作。为了控制延迟值得吗?

留下回复


(注:此名称将公开显示)

Baidu