中文 英语

相干光学能否降低数据中心的功耗?

用光学信号代替电信号的好处和坏处。

受欢迎程度

随着光带宽需求的增加,系统设计人员正在转向“相干”调制方案,这种方案可以在相同的激光上放置更多的数据,并在长连接时降低功率。

一个新的问题是,这些节省是否也可以实现在数据中心内的短连接。

“相干是所有事情发展的方向,因为对于一个给定的系统和功率预算,你试图尽可能多地打包数据,”詹姆斯·庞德(James Pond)说,他是光电公司的首席产品经理有限元分析软件.“连贯的数据通信是一种打包更多数据的方式。”

除了在更远距离的应用中使用外,相干光学还有望帮助降低数据中心内部通信所需的功率。这可以通过降低单个激光功率以及减少使用的激光数量来实现,但支持电路可能会使这些节约更难实现。

数据中心的光子学
如今安装的光子学大多用于长距离传输——信号可以传输数千公里。在该应用程序中,功率应该是一个考虑因素,但更大的焦点在于数据中心。

随着数据中心工作负载的增长,需要从更多的地方移动更多的数据。目前,大部分交易都是通过铜线进行的。光学的影响主要体现在跨校园或从一个数据中心到另一个数据中心的连接比长途更短的距离。

除此之外,移动到分解当今服务器上的组件带来了承诺和挑战。其承诺是可以更有效地利用数据中心的资源。挑战在于,以前可能在同一台服务器上配置的资源现在可能需要在更远的地方工作。

这种配置将挑战铜提供足够低延迟的能力,而光子学提供了明显的解决方案。如果这种情况发生,光子学将在整个数据中心扩散,在这些中心,电源和电源效率是至关重要的。

激光在哪里
链路的典型光子学配置相对简单。激光产生的光可以被调制,然后沿着线路传输。最后,接收器检测到光线并解码信号。

光子学的好处是沿途的传输或组件都不会在工作中消耗能量。相反,任何必要的能量都被内置到原始激光输出中,使激光器成为能量的唯一消费者。这反过来又使激光成为低功率的主要候选。

对于能够维持高成本实现的应用,III-V材料既可以提供激光又可以调制信号。但是数据中心的激增要求低成本的光子学,而硅光子学可以提供很多所需的东西。然而,它不能提供的一件事是激光功能本身。作为一种间接带隙材料,硅不能产生激光,只能操纵激光。

因此,数据中心内的任何连接都需要非硅激光器与硅光子学.目前,这往往意味着可插拔的光学模块,其信号必须转换为电信号才能传输到最终目的地。该电气链路往往是SerDes来处理高带宽,因此它也是一个重要的能源消费者。

如果这项技术能够被开发出来,激光器就可以和硅一起封装先进的包.这消除了对电气链路的需要,降低了功率。但事实是,使用这种模型,每个连接都需要激光。

因此,在数据中心使用今天的标准方法转向光子学意味着需要大量的激光器,每一个激光器都必须产生足够的强度来可靠地传递有效载荷。

激光会产生热量,而这些热量必须得到控制——可能需要额外的冷却,这也会消耗能量。这为降低功率提供了三个机会:减少每个激光的功率,减少激光的数量,以及作为连锁效应,减少所需的冷却量。

走向连贯
传统光学是基于振幅的。也就是说,与常见的直觉一致,光信号是通过改变光的振幅或强度来调制的,从而将数据传输到目的地。简单地说,这类似于大多数电子数据信号如何通过电线传输。

传统方法的挑战在于,被调制的原始激光束的功率必须足够强,以确保数据完整地到达接收器。这意味着它不能仅仅被接收器探测到;检测到的信号必须比其他任何噪声都强,这样才能清晰可靠地将其与噪声分离。

“振幅噪声是由色散和非线性组成的,”该公司技术营销经理Jigesh Patel表示Synopsys对此.色散可以通过DSP在接收器处进行补偿,但非线性很难克服(并且可能不可能完全补偿)。激光功率越高,光纤非线性越强。

相干调制不是把携带的信息放在激光的振幅上,而是放在相位上。相位噪声不是什么问题。“相位噪声对性能不利,但现代激光器的线宽比以前窄,”帕特尔继续说。“线宽越大,相位噪声就越大。”

因此,原始激光的强度可以降低到调制信号在端点处可以检测到的程度。振幅中的噪声不会影响相位关系,允许这种方法完全绕过噪声。

图1:基本相干调制的简化图。左图显示的是测量振幅的标准调制。该振幅必须充分高于接收机的噪声(灰色),才能可靠地接收。右边的图像显示相干调制,其中相位,而不是振幅,被测量。因此振幅可以更低。(这并没有说明偏振和正交的使用。)资料来源:Bryon Moyer/Semiconductor Engineering

图1:基本相干调制的简化图。左图显示的是测量振幅的标准调制。该振幅必须充分高于接收机的噪声(灰色),才能可靠地接收。右边的图像显示相干调制,其中相位,而不是振幅,被测量。因此振幅可以更低。(这并没有说明偏振和正交的使用。)资料来源:Bryon Moyer/Semiconductor Engineering

这种调制方法的主要动力是更高的带宽。与标准调制不同,相干系统可以利用光偏振和正交。

Patel说:“相干系统允许以光的两种偏振(x和y)的同相和正交分量发送信息,因为dsp可以从偏振和同相和正交分量中恢复数据。”这将使带宽至少增加四倍。

庞德解释说:“你发送的不是0和1,而是许多符号。”“通过优化利用光的不同振幅和相位,你可以发送多个符号。这就是为什么人们开始谈论波特率而不是比特率。你可以在一段时间内获得32或64个符号。”

这是对于给定波长的光。Pond补充说:“你可以将所有不同波长的光纤相乘。”

改变了相干性后,其他技术可以进一步提高带宽。庞德说:“人们可以使用一系列不同的高级调制格式。

Patel表示了认同。“有些格式可以让你打包超过4倍(比如16倍和64倍)的数据,但这样一来,覆盖范围就会变得有点短。”

这带来了一些额外的好处。庞德指出:“如果你避免了激光的大波动和振幅,这也解决了许多问题。”

例如,可能不需要在线放大。“相干系统消除了在链路中使用光学放大器的需要,”帕特尔说。“掺铒光纤放大器(EDFAs)等光学放大器价格昂贵,需要额外的激光器来获得更高的增益,并且需要额外的维护。”

相干调制与功率
功率成为一个额外的好处,至少对激光子系统本身来说是这样。通过产生更少的激光功率,热量变得更容易管理,通过降低(但不一定消除)冷却要求来进一步降低功率。

帕特尔说:“由于信息不再处于强度中,你不需要太用力地驱动激光。”“你只是有一些探测器可以探测到的最小功率。”

这样的连接已经被计划用于较短的数据中心之间的连接,在一个给定的数据中心中可能有几十个这样的连接。最大的问题是,这是否也适用于数据中心。

接收和解码相干信号更为复杂。使用传统的方法,你只需要检测信号的强度。Patel解释说:“要么是PIN光电二极管,要么是雪崩光电二极管。”“它唯一的功能就是将光功率转换成电流。”

但这不能用于相位检测。“一旦它被转换成电流,你就失去了相位信息,”他说。“你需要在接收端想出一些技巧,这样你就可以回忆起阶段。这个阶段信息的副作用是,你的接收器变得有点复杂。”

目前,需要增加DSP电路,可能会提高接收机的功率。在使用更高激光功率的较长链路上,这仍然可以实现更低的净功率,但如果在许多连接中使用光纤取代铜,那么在数据中心内使用的较短链路上就不那么清楚了。

这种增加是否能被较低的激光功率所弥补还不明显,因为这些激光器一开始就是低功率的激光器。

Patel说:“相干传输是数据中心之间通信的一个很好的选择,但在数据中心内部连接中,由于每个收发器都有DSP,因此成本昂贵(而且可能更耗电)。”“规模经济和技术的改进可能会使未来数据中心内部的一致性成为可能。”

重新定位激光?
如果不需要将激光与每个单独的连接连接起来,功率还可以进一步降低。这些链路显然需要可调制的光,但每个链路使用激光是长期遗留问题的一部分。重新考虑这一方法可能会为进一步削减电力提供机会。

Pilot Photonics在2018年光纤通信会议研讨会上指出了这种可能性,该研讨会由AIST(日本先进科学技术研究所)、东京大学、卡尔斯鲁厄理工学院(KIT)和Finisar的团队进行。

Pilot Photonics联合创始人兼首席技术官Frank Smyth解释说:“我们的想法是,大部分流量都是光学切换,而不是电子切换每个数据包,只有一部分是电子切换。”“这节省了大量的电力,从电力消耗的角度来看,数据的持续增长是可持续的。”

将数据中心光学链路的数量从几十个增加到数千个,这意味着必须尽可能地利用硅光子学,以利用硅加工的较低成本。由于每个环节都需要III-V级材料,而且包装在密封的包装中,这些成本的节省受到了阻碍。相反,一个更高功率的激光器可以用来服务一排机架。

“你可以用磷化铟来发光,”史密斯说。“然后你可以用氮化硅在一个非常宽的梳子上制造微谐振器。然后你把梳子送到机架上的每台服务器上。每一个都有一个绝缘体硅光子IC,它有调制器和高速光子学。你可能有几百个光源,每个架子或每排架子上都有一个光源。”

在大多数情况下,这允许最好的材料用于光的产生,因为有更少的实例。Smyth说:“氮化硅提供了非常低损耗的波导,同时还具有非线性特性(当用InP激光器泵浦时),使它们成为生成光学梳的理想材料。”

生成的光可以供每个环节独立调制,这是“最佳材料”生成方面的一个例外。虽然不是最好的调制材料,但它已经足够好了,而且经济上需要它。

考虑到单个激光将为许多链路提供足够的能量,它将是一个更高强度的光束,尽管它被输送到机架时,它不会携带任何信息。

Smyth指出:“集中化的一个好处是,你可以使用EDFA同时放大所有通道,赋予你更大的功率,并允许你将数据分发到更多的机架。”“edfa非常高效,所以你可以获得大量集中和相对高效的收益。”

虽然上面已经提到edfa相对昂贵,但每个激光只需要一个,而不是每个链路一个。

激光冷却将集中完成,消除了服务器级激光冷却的需要。这种中央冷却将比当前架构所需的分布式冷却更有效。处理光子学的芯片将不再需要密封,从而降低成本。

这并不是说机架不需要冷却。高功率计算可能仍然需要冷却。但它不需要冷却每个机架中的激光。

在机架内,这将提供相当于电力和地面轨道旁边的轻轨。中央激光发电系统需要非常可靠,因为激光故障会影响大量的链路,而不仅仅是一个。激光源可能需要冗余。

图2:服务器机架可以受益于一个集中的激光源。在这个简化的描述中,黄色表示激光;桃色表示光通过纤维分布;蓝色表示冷却。上图显示了每个链接的单个激光器(为了简单起见,每个架子显示两个)。所有这些激光都需要冷却。下图显示了一个集中的激光,在那里冷却可以集中在激光本身,而不是通过机架分布。没有显示冷却需要的其他芯片。资料来源:Bryon Moyer/Semiconductor Engineering

图2:服务器机架可以受益于一个集中的激光源。在这个简化的描述中,黄色表示激光;桃色表示光通过纤维分布;蓝色表示冷却。上图显示了每个链接的单个激光器(为了简单起见,每个架子显示两个)。所有这些激光都需要冷却。下图显示了一个集中的激光,在那里冷却可以集中在激光本身,而不是通过机架分布。没有显示冷却需要的其他芯片。资料来源:Bryon Moyer/Semiconductor Engineering

这样,数据中心就可以从以下几个方面得到好处:

  • 相干信号需要低功率激光器;
  • 单束激光比多束激光效率更高,而且
  • 冷却功率可以降低。

此外,对于使用可插拔光学器件的链路,可以消除耗电电SerDes链路。剩下的问题是相干接收机所需要的dsp在多大程度上抵消了这些节省。

如今新的光学标准都集中在相干调制上。Smyth说:“第一个基于以太网等标准的相干收发器刚刚发布。”“它叫400zr。这是为长途网络标准化相干光学的一次尝试。”

除此之外还有更多。“使用800 ZR,一切都是连贯的,”帕特尔说。“400zr也基本上是连贯的。”

但短程光学连接可能需要新的标准来实现数据中心内的互操作性。这样的标准可能需要几年时间才能完成。

结论
在数据中心之间转向相干光学才刚刚开始。帕特尔说:“2022年,微软将在他们的数据中心推出这种互连。”

在数据中心内,促使从铜到光纤的转变仍然是一个相对较长的时间。可能会导致严重的体系结构更改,而且此类更改不是轻易做出的。OFC的报告提出,2028年可能会实现这一目标。

“这是一种相当颠覆性的架构,与今天的数据中心架构非常不同,”Smyth警告说。“我不认为它在任何地方都在使用,但大多数技术块现在都是可用的,所以如果一些超大规模数据中心运营商接受它,这样的架构可能会在五年内部署。大部分交通采用光交换,只有一小部分采用电交换,这种额外的好处可能有点遥远,因为这种规模的光交换仍然是一个更大的挑战。”

相关的
协同封装光学器件会取代可插拔器件吗?
新的选择为更快、更可靠的系统打开了大门。
如何提高数据中心的能源和电源效率
优化服务器芯片和软件的能源和电源效率是一项多方面的挑战,涉及许多活动部件。



留下回复


(注:此名称将公开显示)

Baidu