中文 英语

共同封装的光学器件会取代可插拔的吗?

新选项将门打开到更快,更可靠的系统。

人气

随着光纤连接深入数据中心,一场争论正在进行中。使用可插拔的光学模块还是将激光器深入到高级封装中更好?讨论中存在着便利性、电源和可靠性等问题,最终的赢家还不清楚。

“该行业绝对拥有共同包装的光学,”光子学专业产品经理James Pond说Ansys.“它的到来并不一定是为了取代数据中心收发器,而是为了实现人们想要实现的一切。”

基于可插拔光学器件用于长途光学器件,可插拔光学器件是目前的默认选择。共封装光学器件(CPO)有一些前景,但这项技术需要克服可靠性问题,才能被完全接受。一旦它达到商业地位,它可能会引入新的应用程序,而不是取代可插拔。

多年来,光学的主要应用是长途通信。“光学收发器可能不会以相同的方式脱掉,没有可插拔收发器,”池塘说。

可插拔收发器通常使用产生的激光VCSELs并嵌入到模块中。这些模块的形式因素已经发展,但在光纤连接中插入的固有便利性没有改变。

“插件非常非常成功,”池塘说。“原因是他们已经高度模块化了。只要他们符合您所针对的那些通信标准的规范,您就可以从任何供应商交换出来。“

图1:四倍小尺寸可插拔(QSFP)模块。资料来源:Jesse Schulman/CC BY-SA 3.0

图1:四倍小尺寸可插拔(QSFP)模块。资料来源:Jesse Schulman/CC BY-SA 3.0

然而,随着带宽需求的增加,数据中心也在不断发展。此外,越来越需要将数据移动到整个数据中心,甚至移动到另一个数据中心,以提高可扩展性,而不仅仅是在机架内。光学对这种应用很有吸引力,但距离远小于长途通信所需的距离。

数据中心功率始终是一个问题,数据移动是该电源的强大贡献者。“数据中心每年的速度增长50%或更多,”Arista网络主席和首席开发官员在今年的热门互连会议上的演示文稿中观察到Andy Bechtolsheim。“并且每位的网络功率大约有大约一半的速度,这意味着在包括光学器件,包括光学器件的网络中使用的电力量以不健康的速度增长。”

这有助于通过提供激光功率的最佳方式产生辩论。默认情况下,可插拔光学是现任技术。所谓的“板载光学”(obo)是将光学更深的服务器或其他系统移动到服务器或其他系统的第一步。但是集成了芯片封装内的激光源已经发射了想象力,现在它是由开发人员造成的硬看。

将信号通知到他们需要的地方
有了可插拔的收发器,光学模块就可以插到系统的一侧,这差不多就是所需要的一切。激光源在模块中,所以它不是计算系统的一部分。庞德说:“如果其中一个坏了,你只要拔掉它,然后接上一个新的。”

但是信号被插入的地方并不是用来计算的地方。Pond解释说:“可插拔收发器的缺点是,您必须从芯片或板到可插拔收发器进行电气通信。”。考虑到今天的速度,这种连接通常是一种电气连接。

Pond说:“你可能还会遇到重定时的问题,这取决于可插拔收发器的标准。”“因此,在这个过程中,你开始消耗大量的能量,当你达到更高的速度时,就会有更多的射频损耗,仅仅是到达可插拔收发器的前面板。”

使用CPO,激光源可以被放置在与关键计算电子学相同的封装中。I/O芯片可以将接收到的激光转换成电信号,或者根据需要从相邻ASIC移动极短距离的电信号输入来驱动光信号输出。

“你将光纤完全带入系统,非常接近开关ASIC,”光子解决方案总监Twan Korthorst解释说:新思科技. “您可以在交换机ASIC附近创建光I/O芯片,以接收光连接。”

在这种情况下,光纤将一直驱动到服务器中,从而消除了电气的需求并行转换器联系。这在较低的整体系统功率上具有较低的承诺,同时仍然有助于增加带宽。

图2:在顶部,QSFP模块插入系统边缘,在那里信号被转换成电信号并通过SerDes链路发送到ASIC。底部显示了一个共封装选项,其中光纤一路运行到高级封装,在那里I/O芯片进行电转换,立即交付到相邻的ASIC。资料来源:Bryon Moyer/半导体工程

图2:在顶部,QSFP模块插入系统边缘,在那里信号被转换成电信号并通过SerDes链路发送到ASIC。底部显示了一个共封装选项,其中光纤一路运行到高级封装,在那里I/O芯片进行电转换,立即交付到相邻的ASIC。资料来源:Bryon Moyer/半导体工程

但是,由于这种激光在安装在板上的包装内深入埋入,因此失败的激光器意味着更换整个板 - 与切换可插拔模块相比的相对容易相比,昂贵的前景。

在包装内产生激光
产生激光有多种选择,但没有一种涉及硅。虽然硅可以用来引导和调制激光,但它是一种间接带隙材料,这意味着它不能轻易产生激光。必须使用其他一些材料-通常是像磷化铟这样的III-V物质(尽管并非所有III-V材料都有直接带隙)。

Korthorst说:“人们想要片上激光器,但硅不能带来光。”。“因此,您必须有一些异构集成解决方案,可以在硅上放置材料。”

像VCSEL等批量半导体源正在向量子阱和量子点等较小的源。“量子阱具有更高的增益和更高的功率输出[比量子点],”Synopsys技术营销经理Jigesh Patel说。“但如果你正在做连贯的调制,那么你不需要那么多电源。”

量子点被证明更坚固,温度更稳定,但效率较低。虽然所有这些激光器的输出功率都低于长距离激光器的输出功率,但这并不构成问题。Korthorst说:“当你从数据中心的一端到另一端,或者从一个数据中心到另一个数据中心时,距离是完全不同的。”。“因此,您可以轻松地享受光功率预算。”

长期而言,有一些研究项目试图确定添加到硅中的材料是否能使其产生激光。帕特尔说:“人们正在研究是否可以通过掺杂锗或铒来从硅中发射激光。”“但我没有看到任何大规模部署或商业利益。”

另一种选择是异质外延,其中激光材料实际上是硅的种植型以产生准整体结构。“通过首先创造一个具有某种形状的小边缘沟槽,当您在彼此顶部生长时,您可以放松机械应力,”Korthorsts说。同样,这仍然是一个研究主题。

功率考虑因素
绝望的能量是激光本身的产生。对于长途应用,该功率需要足够高,以便旅行长距离。

“CPO后面的原始动机是通过改变来自高功率的服务的电气接口来减少电力,如LR [LONG REACH],这是今天的筹码的标准服务,到那么刚刚的低功耗服务Bechtolsheim说,足以让CPO驱动到多芯片载体上的CPO,然后将该芯片从该芯片移到前面板上。“

有人试图定义一种“极端(或额外)短距离”或“XSR”标准,该标准将需要降低约20%的激光功率。“这实际上并没有发生,”他继续说道。“这项服务需要为开关芯片和数字信号处理器(dsp)提供一个完整的5纳米专用磁带。目前还没有足够的经济条件来实现这一目标。”

相反,拍摄了15%的功率节省的非常短的(VSR)方法,其中3纳米开发进一步降低了先前的7纳米生成的功率。转向相干调制的移动具有进一步降低功率的承诺。

Bechtolsheim说:“电力状况每两代人就会改善大约两倍。”“这对光学也是如此。”

但无论使用可插拔或CPO,这些电源改进都将适用。因此,虽然这些都是降低数据中心功耗的有用开发,但它们不一定会使指针朝着一个或另一个解决方案移动。

只有CPO带来的一个有益电力变化是消除Serdes Link。“那个Serdes使用了很多电力,”korthorsts表示。

能量消耗随速度而增长,尽管移动到更具侵略性的硅节点可以改善事物。删除该链接应从整体系统电源角度下发出CPO NOD。

在共封装收发器时,解决模块化的一种方法是只移动激光到边缘,但这有负面的功率后果。

“为实现CPO的高可用性,人们已经采用了外部光源的概念 - 如果该模块中的激光发生故障,则可以更换前面板上的可插拔模块,”Bechtolsheim说。“与传统的可插拔解决方案相比,存在额外的耦合损耗,其实际上需要额外的激光功率。”

灰尘成为此设置的另一个问题。“您最有可能还需要扩展的光束连接器以避免灰尘污染,并且扩展的光束连接器比传统的单模连接器更高,”Bechtolsheim解释说。“分离器的组合和偏振的组合为每个连接器的0.6到1.2 dB的损耗。当您拥有这些额外的连接器时,光学侧最终最终有大约2 dB的额外损耗,与可插拔光学模块相比,将激光功率提高50%。“

可靠性考虑
CPO的可靠性问题可以管理昂贵。“如果激光片上芯片,并且它失败,您必须更换整个板,”Korthorsts说。

这在经济上毫无意义。Bechtolsheim说:“从整体可靠性、可制造性和可使用性模型来看,你不会想要仅仅因为一个激光器失效就更换一个非常高性能、高功率的系统。

长距离激光倾向于可靠。但萎缩和集成可以通过电光和热效应驱动的问题。可以管理一些问题,但集成使得更加困难。如果未正确处理,过热也会影响共封装电子器件的性能。

较小的量子激光器倾向于首先具有低产量,其中多达50%未能正常工作。然后有一个衰老的问题 - 而且特别是高婴儿死亡率。这是可插拔模块的优势变得清晰的位置。

Synopsys公司的帕特尔说:“你生产1000台相同设计的激光器,但在1000台中,只有一定数量的激光器能满足你的设计规格。”“在这些之外,在一定的时间内,输出功率将下降一半。这就是量子力学的本质。”

当然,可靠性对于服务器系统的任何部分都很重要 - 但我们没有为CPU或GPU具有模块化选项。“如果CPU和内存之间的互连休息,您可能只需购买一个新的主板,”观察到池塘。

不同之处在于,激光器的可靠性明显低于其他部件。如果这种可靠性可以提高到与其他芯片相当的程度,那么模块化就不那么重要了。Pond说:“要么让它更模块化,要么让它更可靠。”。“要达到这样的可靠性水平,我们还有很长的路要走。”

热问题使问题复杂化。“光学器件对热量非常敏感,因此您不断热调整,”池塘说。“我们使用热效应来调整光学器件以保持其工作。但问题是,当其他一切都开始加热并加热光学器件,那么你的调整可以开始失控,你必须开始消耗一大吨的电力只是为了保持光学器件来保持光学器件一切都在曲调。“

量子点可能会提供一些缓解。帕特尔说:“材料的粗糙度和激光角度决定了可靠性,而量子点对这些变量更不敏感。”。“量子点拥护者说,量子点的好处可以克服可靠性问题。”

在研究基本可靠性机制的同时,许多激光器选项也在探索冗余。其想法是提供多个激光器,一次只运行其中一个。如果该电路板出现故障,则可以启动备用电路板以继续运行,而无需卸下该电路板。

很容易将这种冗余与Ranovus最近在一块芯片上创建约3000万个量子点的方法混淆。它们为深波分复用(DWDM)提供多种颜色,但每种颜色仍会留下大量的点。

“他们堆叠在一起,”Ranovus首席执行官Hamid Arabzadeh说。“这些是自我组装的点,所以没有面具。”

这里,激光的定位可以取决于所产生的信道的数量。“如果你超越32个频道,客户希望激光在外面,”阿拉伯扎德说。“如果它少于32个通道,那么我们可以将激光连接在硅光子上的顶部。对于内部激光源,我们在我们的整体芯片内具有激光掉入的空腔。当您卸下激光器时,光从激光器的边缘耦合到光子上。“

图3:顶部图像示出了典型的共封装配置,用电子设备安装在光学器件上,该电子设备坐在保持完整光学发动机的基板上。底部显示了一个集成芯片,包括驱动器,跨阻抗放大器(TIA)和光学器件。光学器件使用大量的量子点来为DWDM信号产生多个波长。来源:Ranovus.

图3:顶部图像示出了典型的共封装配置,用电子设备安装在光学器件上,该电子设备坐在保持完整光学发动机的基板上。底部显示了一个集成芯片,包括驱动器,跨阻抗放大器(TIA)和光学器件。光学器件使用大量的量子点来为DWDM信号产生多个波长。来源:Ranovus.

从某种意义上说,这些激光器并不是多余的,它们只有一台在运行,备用的在机翼上等待。它们被聚合以提供更高的功率,但也通过纯粹的数字,它们可以承受一些点的失败。它们被设计成相干性的,所以这种组合就像是一个相干性激光。

Ranovus公司表示,他们通过在正常生产周期中使用老化芯片来提高芯片的可靠性,以在发货前消除婴儿死亡率的影响。此外,量子点更好的温度稳定性可以简化温度波动时的一些激光调谐。

将我们的视角从仅仅激光提升到整个系统,消除SerDes链接有助于提高整体可靠性。庞德说:“现在,当传输信号时,你需要使用复杂的铜互连来连接可插拔电源。”“然后,在接收端,你又得到了一个复杂的铜互连。现在你有三个可以用一个替换的连接。由于连接部件更少,因此有可能提高整个系统的可靠性。”

一种设计适合所有人与定制设计
CPO提出了一个额外的挑战 - 必须对每个芯片/激光/包装组合执行先进包装的整个内容的分析。这些包有很多效果要考虑,使模拟和分析所需的多物理工具。包括电子分析,光学分析,信号完整性,热分析,以及模拟基础物理学的能力 - 特别是量子效应。

Pond说:“你正在为一组已经很复杂的电气和热力系统问题添加一个全新的物理层。”。“现在你在上面加上了光学元件。这只会让它更具挑战性。”

更先进的激光器可能会使事情变得更糟。“模拟量子点激光器比传统的MQW(多量子阱)边缘发光激光器更复杂,”他补充道。

类似的挑战在建模整个子系统时适用。“在建模和仿真世界中发生了什么,当我们需要模拟具有电气,光学和电气元件的组合链路时,现在我们需要弄清楚如何建模光发射器和接收器中光纤的行为从根本上与电子电路工作的方式不同,“Todd Westerhoff,产品营销经理,PCB划分西门子EDA

这可以使CPO解决方案的设计复杂化。虽然这些问题对插件也很重要,但模块化意味着可以为模块完成一次,并且该工作将为使用模块的所有应用程序提供服务。CPO破坏了模块化,这意味着每个高级包应用程序必须包括作为设计流程的一部分的详细分析。

现任vs.新贵
考虑到可插拔模块已经在使用,其明显的便利性意味着它们有支持者。SerDes消除似乎是唯一一个可以将可插拔插头从插座中拔出的强大功能。

然而,就可能的效率和整体系统电力而言,对CPO有一定的吸引力。此外,拆除Serdes连接简化了系统设计并提高了系统可靠性。但这是一个更复杂的包装方案的成本,所以尚不清楚它是否将其作为整体更简单的方法。

Pond说:“由于其模块化和易用性,我仍然看到可插拔技术存在了很长一段时间。“CPO将使各种其他可能性成为可能。这可能会从小众应用开始,比如,超高性能计算,你会说,‘我迫切需要这么快的访问速度,这么大的内存,我愿意花很多钱。’”

它也可能是数据中心分解体系结构的一个促成因素。但它可能会也可能不会慢慢地侵入可插拔设备。Pond说:“从长远来看,它们可能会完全取代可插拔墙。”。“但这需要很长时间。光学解决了两个主要问题。一个是,当你走得更快时,损耗不会增加。而你传播的长度不会改变功率损耗。一旦你在两端解决了这些问题,你可以在几乎任何距离上以任何速度传输,而无需额外成本。这意味着f互连的未来将是全光的。”

那么问题就来了,是什么样的光学。目前,CPO似乎还需要做一些证明,才能真正与可插拔光学设备竞争。但CPO承诺将扩大光学在系统中的作用,使其成为可能的发展——即使这意味着与可插拔设备共存。



留下一个回复


(注意:此名称将公开显示)

Baidu