中文 英语

协同封装光学器件会取代可插拔器件吗?

新的选择为更快、更可靠的系统打开了大门。

受欢迎程度

随着光纤连接深入数据中心,一场争论正在进行中。是使用可插拔光模块更好,还是将激光器深入到高级封装中更好?围绕便利性、功率和可靠性等问题展开了讨论,最终的赢家还不清楚。

该公司光子学首席产品经理詹姆斯•庞德表示:“业界无疑正在拥抱协同封装光学器件。有限元分析软件.“它出现的原因不一定是为了取代数据中心收发器,而是为了实现人们希望能够做的所有其他事情。”

可插拔光学是目前默认的基于他们的使用长途光学。协同封装光学技术(CPO)有一定的前景,但该技术需要克服可靠性方面的问题,才能得到全面应用。一旦它获得商业地位,它可能会带来新的应用程序,而不是取代可插拔程序。

多年来,光学的主要应用一直是长途通信。庞德说:“如果没有可插拔式收发器,光收发器可能不会以同样的方式发展。”

可插拔收发器通常使用激光产生的光VCSELs并嵌入到模块中。这些模块的外形因素已经发生了变化,但插入光纤连接的固有便利性并没有改变。

庞德说:“可插拔设备非常非常成功。“原因是它们是高度模块化的。只要它们符合你的目标通信标准的规范,你就可以从任何供应商那里交换它们。”

图1:四小尺寸可插拔(QSFP)模块来源:Jesse Schulman/CC BY-SA 3.0

图1:四小尺寸可插拔(QSFP)模块来源:Jesse Schulman/CC BY-SA 3.0

然而,随着带宽需求的增加,数据中心也在不断发展。此外,不仅需要在机架内移动数据,还需要在整个数据中心范围内移动数据,甚至需要将数据移动到另一个数据中心以提高可伸缩性。光学对于这种应用很有吸引力,但距离远小于长途通信所需的距离。

数据中心的功率一直是人们关注的问题,而数据移动是这种功率的重要贡献者。Arista Networks的董事长兼首席开发官Andy Bechtolsheim在今年的Hot Interconnects会议上的一次演讲中指出:“数据中心以每年50%或以上的速度增长。”“每比特的网络功率以大约一半的速度下降,这确实意味着网络(包括光学)消耗的功率正在以不健康的速度增长。”

这引发了一场关于提供激光能量的最佳方式的辩论。默认情况下,可插拔光学是现有的技术。而所谓的“板上光学”(on-board optics, OBO)是将光学系统深入到服务器或其他系统的第一步。但是将激光源集成到芯片封装中已经激发了人们的想象力,现在它正受到开发人员的严格关注。

把信号传送到需要的地方
通过可插拔收发器,可以将一个光学模块插入系统的一侧,这几乎就是所需要的全部。激光源在模块中,所以它不是计算系统的一部分。庞德说:“如果其中一个坏了,你只需拔下插头,再插上一个新的。”

但是插入信号的地方并不是信号用于计算的地方。Pond解释说:“可插拔收发器的缺点是,你必须从芯片或电路板到可插拔收发器进行电通信。考虑到今天的速度,这种连接通常是电气SerDes连接。

Pond说:“根据可插拔收发器的标准,你可能还会遇到重新计时的问题。“所以在这个过程中,你开始消耗大量的能量,随着速度的提高,在到达可插拔收发器的前板时,你会有更多的RF损失。”

使用CPO,激光源可以被放置在与关键计算电子器件相同的封装中。I/O芯片可用于将接收到的激光转换为电信号,或根据需要从邻近的ASIC移动极短距离的电子输入将光信号驱动出来。

该公司光子解决方案总监Twan Korthorst解释说:“将光纤完全带入系统,非常接近开关专用集成电路Synopsys对此.“并且您可以在交换机ASIC附近创建光学I/O芯片,以接收光学连接。”

在这种情况下,光纤一直驱动到服务器,消除了对电气的需求并行转换器连接。这样可以降低系统的整体功耗,同时还能增加带宽。

图2:在顶部,一个QSFP模块插入到系统边缘,在那里信号被转换为电信号,并通过SerDes链路发送到ASIC。底部显示了一个联合封装选项,其中光纤一直运行到高级封装,其中I/O芯片进行电转换,以便立即交付到相邻的ASIC。资料来源:Bryon Moyer/Semiconductor Engineering

图2:在顶部,一个QSFP模块插入到系统边缘,在那里信号被转换为电信号,并通过SerDes链路发送到ASIC。底部显示了一个联合封装选项,其中光纤一直运行到高级封装,其中I/O芯片进行电转换,以便立即交付到相邻的ASIC。资料来源:Bryon Moyer/Semiconductor Engineering

但是,由于这种激光器深藏在安装在电路板上的封装中,如果激光器出现故障,就意味着要更换整个电路板——与更换可插拔模块相对容易相比,这是一个昂贵的前景。

在封装内产生激光
产生激光的方法有很多种,但都不涉及硅。虽然硅可以用来引导和调制激光,但它是一种间接带隙材料,这意味着它不能轻易地产生激光。必须使用一些其他材料-典型的III-V物质,如磷化铟(尽管不是所有III-V材料都有直接带隙)。

“人们想要片上激光器,但硅不能带来光,”Korthorst说。“所以你必须有某种异质集成解决方案,可以把材料放在硅上。”

像VCSELs这样的大型半导体源正在让位于量子阱和量子点等较小的半导体源。“量子井(比量子点)有更高的增益和功率输出,”Synopsys的技术营销经理Jigesh Patel说。“但是如果你在做的话连贯的调制,那么你就不需要那么大的功率。”

量子点被证明更强大,温度更稳定,但它们的效率较低。虽然所有这些激光器提供的功率都低于远程激光器,但这并不是问题。Korthorst说:“当你从数据中心的一边到另一边,或者从一个数据中心到另一个数据中心时,距离是完全不同的。“所以你可以放松光功率预算。”

长期来看,有一些研究项目试图确定添加到硅中的材料是否可以使其产生激光。帕特尔说:“人们正在研究是否能找到一种通过掺杂锗或铒从硅中激光的方法。”“但我还没有看到任何大规模部署或商业利益。”

另一种选择是异质外延,即将激光材料生长在硅上,以创建准单片结构。Korthorst说:“当这些不匹配的材料相互生长时,首先创建一个具有特定形状的小边缘沟槽,就可以缓解机械应力。”这仍然是一个研究课题。

功率因素
一个重要的能源消耗者是激光本身的产生。对于长途应用,需要足够高的功率来传输很长的距离。

Bechtolsheim说:“CPO最初的动机是通过改变电接口来降低电力,从高功率服务,如LR(长到达),这是当今芯片上的标准服务,到低功率服务,足以在多芯片载波上驱动CPO,然后从该芯片到前面板变成光学。”

人们试图定义一个“极(或额外)短距离”或“XSR”标准,该标准将需要低20%的激光功率。“这实际上并没有发生,”他接着说。“这项服务将需要一个完整的5纳米专用胶带,用于开关芯片和dsp。但目前还没有足够的经济条件来实现这一点。”

相反,他们采用了极短距离(VSR)的方法,节省了15%的功耗,3nm的开发进一步降低了功耗,低于之前的7nm一代。转向相干调制有望进一步降低功率。

Bechtolsheim说:“每两代工艺,电力状况就会改善大约两倍。”“光学也是如此。”

但无论使用可插拔还是CPO,这些电源改进都适用。因此,虽然这些都是降低数据中心功耗的有用发展,但它们并不一定会将指针转向其中一个或另一个解决方案。

只有CPO带来的一个有益的能力变化是消除SerDes链接。Korthorst说:“SerDes消耗了大量电力。

能源消耗随着速度的增长而增长,尽管转移到更激进的硅节点可以改善情况。从整体系统功率的角度来看,移除这一环节将使CPO获得认可。

在协同封装收发器时,解决模块化问题的一种方法是只将激光移到边缘,但这有负功率的后果。

“为了实现CPO的高可用性,人们采用了外部光源的概念——在前面板上的一个可插拔模块,如果模块中的激光器出现故障,可以更换该模块,”Bechtolsheim说。“与传统的可插拔解决方案相比,它有额外的耦合损耗,实际上需要额外的激光功率。”

灰尘成为这个设置的另一个问题。Bechtolsheim解释说:“你很可能还需要膨胀梁连接器来避免灰尘污染,而且膨胀梁连接器比传统的单模连接器具有更高的损耗。”“分路器和偏振的结合使每个连接器的损耗在0.6到1.2 dB之间。当你有了这些额外的连接器时,你最终会在光学方面增加大约2 dB的额外损耗,与可插拔光模块相比,这将使激光功率增加50%。”

可靠性方面的考虑
CPO的可靠性问题管理成本很高。Korthorst说:“如果芯片上的激光器失效了,你就必须更换整个电路板。”

这在经济上毫无意义。Bechtolsheim说:“从整体可靠性、可制造性和可使用性模型来看,你不会想要仅仅因为激光器失效就更换高性能、高功率的系统。”

远程激光往往是可靠的。但由于光电效应和热效应的驱动,收缩和集成会产生问题。有些问题是可以管理的,但集成使其更加困难。如果处理不当,多余的热量也会影响协同封装电子产品的性能。

首先,较小的量子激光器往往产量较低,其中多达50%的激光器无法正常工作。还有老龄化问题,特别是婴儿死亡率高。这就是可插入模块的优势变得清晰的地方。

Synopsys的帕特尔说:“你制造了1000个相同设计的激光器,但在1000个激光器中,只有一定数量的激光器符合你的设计规格。”“其中,在一段时间内,输出功率将下降一半。这就是量子力学的本质。”

当然,对于服务器系统的任何部分来说,可靠性都是很重要的——但是我们还没有针对cpu或gpu的模块化选项。旁德说:“如果CPU和内存之间的连接中断,你可能只需要买一块新主板。”

不同之处在于激光器的可靠性明显低于其他部件。如果这种可靠性可以提高到与其他芯片相同的水平,那么模块化就不那么重要了。庞德说:“要么让它更模块化,要么让它更可靠。”“要达到那种可靠性水平,我们还有很长的路要走。”

热问题使事情复杂化。“光学对热非常敏感,所以你要不断地进行热调谐,”庞德说。“我们使用热效应来调整光学器件以保持它们工作。但问题是,当其他一切都开始升温并加热光学器件时,你的调谐就会开始失控,你必须开始消耗大量的能量来继续加热光学器件以保持调谐。”

量子点可能会缓解一些压力。“材料的粗糙度和激光角度决定了可靠性,而量子点对这些变量更不敏感,”帕特尔说。“量子点的支持者说,量子点的好处可以克服可靠性问题。”

在研究基本可靠性机制的同时,许多激光方案也在探索冗余性。这个想法是提供多个激光器,同时只有一个激光器在工作。如果该板失效,则可以启动备用板继续操作,而无需移除该板。

这种冗余很容易与Ranovus最近的一种方法相混淆,后者在单个芯片上创建了大约3000万个量子点。它们为深度波分复用(DWDM)提供了多种颜色,但每种颜色仍然留下大量的点。

Ranovus首席执行官Hamid Arabzadeh表示:“它们是堆叠在一起的。“这些是自我组装的点,所以没有面具。”

在这里,激光的定位取决于产生的通道的数量。Arabzadeh说:“如果超过32个渠道,客户希望激光器在室外。”“如果它小于32个通道,那么我们可以将激光连接到硅光子学上。对于内部激光源,我们在单片芯片中有空腔,激光被投进去。当你把激光放入里面,光就会从激光边缘耦合到光子学中。”

图3:上图显示了典型的协同封装配置,电子器件安装在光学器件之上,光学器件位于支撑完整光学引擎的基板上。底部显示了一个集成芯片,包括驱动器、跨阻放大器(TIA)和光学器件。光学器件使用大量的量子点来生成DWDM信号的多个波长。来源:Ranovus

图3:上图显示了典型的协同封装配置,电子器件安装在光学器件之上,光学器件位于支撑完整光学引擎的基板上。底部显示了一个集成芯片,包括驱动器、跨阻放大器(TIA)和光学器件。光学器件使用大量的量子点来生成DWDM信号的多个波长。来源:Ranovus

这些并不是多余的激光器,因为只有一个激光器,备用激光器在机翼上等待。它们聚集在一起可以提供更高的能量,但从数量上来说,它们可以承受一些点的失败。它们被设计成相干的,所以这种组合就像一个相干激光。

Ranovus表示,他们通过将芯片老化作为正常生产周期的一部分来提高可靠性,以消除发货前婴儿死亡率的影响。此外,量子点更好的温度稳定性可以简化一些随着温度波动的激光调谐。

将我们的视角从激光提升到整个系统,消除SerDes链接有助于提高整体可靠性。庞德说:“现在,当传输信号时,你需要这个复杂的铜互连来连接到可插拔。”“然后,在接收端,你又有一个复杂的铜互连。现在你有了三个互连点,你可以用一个代替。你可能会提高整个系统的可靠性,因为你的链接中有更少的部件。”

通用设计vs.定制设计
CPO提出了一个额外的挑战——必须对每个芯片/激光器/封装组合执行高级封装的全部内容分析。这些包有许多需要考虑的影响,使得模拟和分析需要多物理工具。这包括电子分析、光学分析、信号完整性、热分析,以及建立基础物理模型的能力——尤其是量子效应。

庞德指出:“你在已经复杂的电气和热系统问题中增加了一个全新的物理层面。”“现在你在上面加上了光学。这只会让它更具挑战性。”

更先进的激光会使情况变得更糟。“模拟量子点激光器比传统的MQW(多量子阱)边缘发射激光器要复杂得多,”他补充道。

在建模整个子系统时也会遇到类似的挑战。“在建模和仿真世界中发生的事情是,当我们需要模拟一个具有电气、光学和电气组件的组合链路时,现在我们需要弄清楚如何模拟光发射器和接收器中的光纤的行为,这与电子电路的工作方式有本质上的不同,”totodd Westerhoff说,他是该公司PCB部门的产品营销经理西门子EDA

这可能会使CPO解决方案的设计复杂化。虽然这些问题对于可插拔也很重要,但模块化意味着它可以为一个模块完成一次,并且该工作将为使用该模块的所有应用程序服务。CPO打破了这种模块化,这意味着每个高级包应用程序都必须包含详细的分析,作为设计流程的一部分。

在职者vs新贵
鉴于可插拔模块已经在使用中,它们明显的便利性意味着它们有支持者。SerDes的消除似乎是唯一强大的故事,可以把可插拔的插座。

然而,就可能的效率和整体系统功率而言,CPO有一定的吸引力。此外,取消SerDes连接简化了系统设计,提高了系统可靠性。但这是以更复杂的包装场景为代价的,所以目前还不清楚它是否会成为一种整体上更简单的方法。

庞德说:“由于模块化和易用性,我仍然认为可插拔设备会在很长一段时间内存在。”“CPO将实现各种其他可能性。这可能会从一些小众应用开始,比如,超高性能计算,你会说,‘我迫切需要这样的速度访问这么大的内存,我愿意为此付出很多钱。’”

它还可能是数据中心的推动者解集架构.但它可能会也可能不会慢慢地侵入可插拔设备。庞德说:“从长远来看,它们可能会完全取代可插拔式电池。”“但这需要很长时间。光学解决了两个主要问题。其中之一是,一旦速度加快,损失不会增加。传播的长度不会改变能量损失。一旦你在两端解决了这些问题,你就可以在几乎任何距离上以任何速度传输,而不需要额外的成本。这意味着未来的互连将是全光学的。”

那么,问题是什么样的光学。目前,CPO似乎还需要做一些证明,才能真正与可插拔光学器件竞争。但CPO承诺扩大光学在系统中的作用,使其成为一种可能的发展——即使这意味着与可插拔设备共存。



留下回复


(注:此名称将公开显示)

Baidu