中文 英语

云驱动器网络芯片架构的变化

新的数据流,更高的开关密度和IP集成创建整个设计流程的问题。

受欢迎程度

云数据中心已经改变了网络拓扑结构和数据在一个大型数据中心移动,如何促使重要改变芯片的架构用于路由数据,提高设计一套全新的挑战。

云计算已经成为数据中心市场的快速增长的部分。事实上,它预计将增长三倍在未来几年里,预计,到2021年占95%的所有数据中心流量,根据思科的全球云指数预测。等式的一个关键部分是虚拟化,它允许计算实例和工作负载的动态分配跟上云服务的动态特性。

从不同的角度看,现在超过75%的交通流在东西方向,从服务器到服务器,在数据中心内。提出了第一组问题,因为传统的南北客户机/服务器三层网络拓扑优化流量,因此不能有效地处理这种数据流。

解决数据流的转变和最小化任何延迟或瓶颈,云数据中心搬到一个叶刺拓扑中,每个叶服务器可以访问其他服务器通过脊柱一跳。


来源:节奏设计系统

”叶刺拓扑中,每个叶子都需要连接到每个脊椎开关,“说Muthukumar Vairavan,高级产品营销经理接口IP节奏设计系统。“作为一个结果,可以支持主机的数量,以及网络带宽扩展,现在成为一个数量的端口和带宽的函数/开关设备的端口。开关设备带宽主要由开关ASIC和光学模块的数量可以融入一个机架单元。”

先进的开关ASIC今天256道PAM-4并行转换器运行在56 gbps,真沸点12.8的总带宽。总的来说,对开关可以支持多达32个端口400 gbe(8车道的56 gbps),他说。”,但对带宽需求与日益增长的超级数据中心规模,开关供应商正在寻找双硅带宽25.6真沸点。传统上这是通过并行转换器巷翻倍速度和光学互连论坛(OIF)正致力于定义112 gbps并行转换器规范,使这个。”

在这些速度的挑战是频道损失非常高和并行转换器需要大量的均衡。复杂的DSP技术用于恢复信号,从而导致重大的功耗。账户,平台设计需要搬到更好的PCB材料和使用活跃的电缆和re-timers保持通道损失在这些速度可控,Vairavan建议。“另一个新兴技术是Optics-On-Board(鄂博),光学芯片放置的位置接近开关ASIC,因此减少了电子渠道。鄂博还提供了更好的光学密度和冷却通过移动远离面板。OIF指定许多类并行转换器的规范,如达到远方,Medium-Reach短延,等等,所以,正确的并行转换器性能/力量权衡可以为特定的开关配置”。

虽然有很多的IP需要构建一个芯片,四个项目通常领导讨论——并行转换器,HBM PHY芯片内存和TCAM网络课程。

“串并收发器必须实现高速芯片外沟通,”Mike Gianfagna说,负责营销的副总裁eSilicon。“HBM PHY需要接口HBM内存堆栈2.5 d包ASIC。网络课程片上内存端口和优化的伪两口的记忆非常高的速度,和tcam (content-addressable内存)是用来实现高效的网络数据包路由”。

有两个额外的维度的IP问题,Gianfagna指出。“首先,silicon-proven、高质量的知识产权是很重要的,但它是不够的。IP也必须验证一起工作。可测试性策略、操作点和金属曲线堆叠的兼容性大大降低集成风险。其次,IP必须与最终应用程序是可配置的。包括编译记忆和tcam来支持不同的配置要求和可编程并行转换器的性能。”

位置,位置,位置
没有单一的方法适用于一切。什么是系统公司寻找从IP提供商取决于应用程序的芯片设计。

“有多种方式来看看这个,”说Manmeet生活,产品营销经理、高速并行转换器Synopsys对此。“首先,在更广泛的层面就是市场服务,无论是企业、校园,数据中心——现在被称为超大型数据中心——或者电信基础设施。如果你把它们放在规模,它从企业开始,较小的数据中心。这个移动到云提供商——谷歌或facebook,亚马逊人——也就是被称为超大型数据中心。最后是服务提供者,丙氨酸,等。根据你服务,从这三个部分的要求是不同的。”

第二个因素是每一个企业所需要的特定功能。“不管是CPU芯片,GPU,一些加速器,适配卡,开关,存储阵列或安全,取决于函数,他们又可以有不同的要求,“生活的说。“第三,从体育的角度来看,这很重要,他们坐在在系统内,是否都是在叶片卡,不管他们是坐在夹层卡,无论是开关架的顶部。那么,他们居住在底盘规定要求。市场整体非常破碎,因为它越来越复杂。”

除此之外,还有另一组开发人员谈论chiplets驱动时死亡的边缘尺寸或十字线,生活的说。“他们想要进入chiplets现在,我们得到顾客的需求要做什么被称为USR并行转换器(超短接触)。这是另一个市场需要解决的问题。”

今天,大多数的网络设计活动是在云中,其中大部分是受到人工智能和机器学习的应用。“有趣的是,所有这些网络公司现在正试图遵循垂直整合模型,他们甚至试图做自己的芯片组,”他说。“在中国,无论是阿里巴巴或者腾讯百度,像facebook,或者谷歌,正在试图做自己的人工智能芯片。他们不想与商人硅。所以至少从知识产权的角度来看,我们的业务度量不是芯片卷。更多的设计开始,绝对我们看到云人驾驶我们的大多数IP业务。

法扎德Zarrinfar, IP业务的董事总经理导师,西门子业务表示同意。“基本处理器不符合要求,所以我们看到关键的oem厂商,领导人的搜索,游戏,领导人和领导沟通的所有开发自己的asic。在ASIC,很明显,有很多取决于应用程序。如果它是一个数据中心的应用程序或如果它是某种形式的汽车应用程序或物联网应用程序中,我们看到很多的构建块。如果你看着multi-gigabit第三层交换机,例如,那么你有1 g和10 g mac(介质访问控制)。一些人包括ASIC芯片内部的收发器和并行转换器和phy进一步增加的水平集成和最小化成本。一些人想让它根据他们的架构。他们保持phy和并行转换器与更大的几何,和他们使用了芯片,使用较大的几何并行转换器。纯粹的数字部分,他们去10 7纳米,甚至向下移动到5 nm finFET技术。”

这种模式出现了迅速在过去的几年里,生活的说。最初,这些公司正试图做低端应用,如相机,但现在他们迁移到高端数据中心,他们正在试图做的越来越多。

对于这些AI /毫升应用,芯片大多是有很多并行转换器与手臂64位处理器。“这是一个数组的手臂高端处理器并行转换器周围,“生活的。通过这些并行转换器”他们所做的是使这些核心以非常高的速度相互交谈,然后这些并行转换器也在奔跑的方式与其他类似的设备。从本质上讲,这是一个输入和一个输出,但是中间的过程是一个指令集,允许他们被重复性和训练在一段时间内阅读人类行为或其他数据,这使得它能够。它允许学习过一段时间,这就是为什么他们需要巨大的处理能力。”

网络设计的另一个方面涉及密度要求。今天,这些翻译集成挑战,生活的说。“集成挑战变得越来越重要,我们已经跟客户把多达300道并行转换器,在某些情况下甚至高达500。需要我们作为一个IP供应商提供很多服务,这样他们就可以将这些并行转换器。需要非常小的区域,即。需要非常狭窄,海滩前把越来越多的沿边缘的phy并行转换器。同时,我们现在需要中可用的物理两个方向,以便优化设计团队把他们在所有四个边的死。这是因为28 nm以下,台积电不允许我们保利方向翻转。但这意味着我们必须有两个不同的设计,两个不同的布局,这样他们可以有效地把这些并行转换器在所有四个侧面。除此之外,我们必须让他们有多个层inside-basically两年,三级深并行转换器内部IP。”

而且,oem与包装越来越精致撞技术而不是标准的C4疙瘩,他指出。“很有可能他们使用interposer-type方法,所以他们需要更广泛,和肿块可能需要牺牲垫或microbump技术。从本质上讲,很多肿块定制需要连同很多后端服务。你怎么把这些东西放在一起?你怎么把所有这些信号在包底物吗?你怎么带他们在SoC ?你好定时关闭速度1 gb /秒或类似的吗?所有这是一个巨大的努力,所以当我们提供这些IPs我们必须提供很多指导如何使用它们。过去曾经是我们的座右铭,IPs很难设计但容易集成。这不是真的了。 They are hard to design and very hard to integrate.”

管理知识产权
许多先进的网络芯片和asic设计今天目标数据中心,功率,性能和面积都是关键因素。这也是最有利可图的部分芯片制造商之一。

“这是云,一切都发生了,”Ranjit说Adhikary,负责营销的副总裁ClioSoft。“每个人都想保持在云中,那里的市场增长。鉴于此,每个数据中心公司希望降低他们的成本,所以权力变成了一个非常重要的组件,以及可靠性。当你谈论下一代网络开关,当你定义一个平台时,你需要确保所有I / O带宽和内存子系统可以实现所需的性能。所以你做你所有的IPs的即插即用。你需要确保他们都使用相同的金属栈、可靠性要求,操作范围,控制interfaces-even DFT方法相同。当你谈论这些事情现在,IP管理平台成为一个严重的组件,因为在一天结束的时候你希望能够得到你想要的IPs。你想找出这些参数是什么,下载它,检查它,而不必通过一个长周期发现如果一个IP工作或不工作或IP支持数据在哪里。”

发现不同的IP块和确定他们是否已经使用其他地方是至关重要的。“很多不同的公司会有不同的科索沃民主党铸造厂,设计团队需要知道如果foundry-verified IP,或者另一个客户在同一公司是使用它,”Adhikary说。“你想要找出IP的可靠性。具体地说,它已经投入生产?有任何问题吗?最终要解决的问题就是如何是功率,性能和记录。我们发现在大多数公司我们进入的信息并不都是在一个地方,它成为重要的知识产权管理体系有关的文件控制系统,这样每个人都保持同步。这只是一个开始。”

展望未来
25.6云服务提供商超越真沸点切换到51.2真沸点,似乎不太可能,传统的缩放技术就足够了。

“开关asic实现先进技术节点利用增加密度和较低的权力,但打标线和产量限制,“生活的说。“迅速越来越受欢迎的一个选择是死解集,在一个大整体模具分为可控的模具尺寸,然后综合multi-chip模块(MCM)包内使用一个高速、低功耗于互连。另一种选择是独立的逻辑死和并行转换器,把它们放在一起在一个罗马数字。需要更大的光密度51.2真沸点可以通过转向于光学、光学模具在哪里与开关集成ASIC死在一个异构的MCM system-in-package (SiP)。纤维可以追踪面板或辫子。”

开关asic和高速光学和电子互联数据中心云时代的中坚力量。满足这些数据中心带宽的爆炸性增长,开关ASIC制造商、光学和互连IP供应商和标准机构需要建立生态系统。未来围绕异构的解决方案,满足新的性能,功率和可伸缩性需求,针对特定的应用程序和独特的数据流。

有关的故事
机器学习更多的工作转移到fpga,出类拔萃
SoC带宽、集成扩展作为机器学习的数据中心使用更多的fpga。
数据中心电源有上升之势
转向云模型保留了功耗,但好处可能会自生自灭。
M2M的网络影响
为什么新架构需要机器与机器开始。



留下一个回复


(注意:这个名字会显示公开)

Baidu