中文 英语

车轮上的数据中心

汽车制造商转向高性能计算芯片,以提高性能和降低系统成本。

受欢迎程度

汽车架构正在从基于领域向区域快速发展,利用数据中心中现有的高性能计算在道路上做出瞬间决策。

这是汽车架构在过去五年中发生的第三次重大转变,这是一次使用7nm和5nm技术、专用加速器、高速内存和高度针对性的软件架构进行集中处理的转变。几十年来,汽车上的大多数电子设备都封装在电子控制单元中,按制动和信息娱乐等功能进行细分。随着越来越多的安全功能被添加和集中,它们被不同的软件堆栈和基于不同域的汽车操作系统组织起来,这些域通过一个集中网关相互通信,这是今天大多数新车使用的网关。

但随着越来越多的自动驾驶功能被添加到车辆中,集中式网关的延迟被证明是不可行的。更紧密的相互依赖性、可伸缩性和灵活性都是必需的,而区域架构允许这些,而原始设备制造商正处于采用这种方法的不同阶段。引人注目的是,汽车分区架构看起来很像按比例缩小的HPC数据中心。

“传统的高性能计算解决方案通常在设计时很少考虑功耗,只考虑对占地面积的影响,”David Fritz观察到西门子数字工业软件.用于汽车的高性能计算也开始类似,并且需要大量额外的计算、冷却和电源设备成本。多年来,这被认为是一种必需品,推动了市场对高昂成本的预测,以及后续的假设,即只有长寿命的公共汽车才能证明高价格是合理的。”

近年来,技术进步已经证明这些假设是不正确的,更好地理解汽车高性能计算的实际需求已经显著降低了整体系统成本。Fritz指出,这使得汽车制造商能够从头开始重新构建下一代平台,使其能够跨多个价值层进行扩展和杠杆化。这反过来又为大众更智能、更安全、更可靠的自动驾驶汽车的愿景注入了新的活力。

区域架构是自动驾驶的关键,其中很大一部分涉及传感器。“你可以在传感器上处理数据,或者在下一步,在层控器中预处理数据吗?汽车解决方案总监Robert Schweiger问道节奏.“或者你可以将原始数据传输到中央计算单元,并将原始传感器数据融合?这是原始设备制造商的愿景,因为这样可以同时为这台超级计算机提供各种信息。这样系统就能做出最明智的决定,而如果你预先做决定,它就像一个决策树。某些假设是预先设定的,这可能会导致非最佳决策。最后可能会有一个更聪明的解决方案,让所有东西都在一个地方同时处理。”

图1:分区架构概念。来源:节奏

图1:分区架构概念。来源:节奏

但这种处理也需要实时进行,特别是与安全相关的决策,这就是为什么如此强调高性能计算能力的原因。

“当我们谈论汽车领域的高性能计算时,我们指的是汽车架构的下一个进化,基于区域网关的架构,”Ron DiGiuseppe说Synopsys对此.“它的不同之处在于,它不是独立的应用领域,而是有各种各样的传感器,无论是动力系统中的传感器,还是汽车的传感器ADAS系统,或者信息娱乐领域的图像传感器。传感器还在那里。他们是独立的,但他们要通过汽车网络/区域网络。分区架构由多个分区网关组成,这些网关本质上是网络交换机。所有这些应用程序都在一个集中的处理模块中,而不是独立的基于应用程序的域,它们都可以使用一个更集中的处理模块来完成。”

图2:车辆分区结构的进展。来源:Synopsys对此

图2:车辆分区结构的进展。来源:Synopsys对此

对于ADAS,设备必须被认为是功能安全的,这意味着它们通常是专门为汽车使用而设计的中央计算芯片。Schweiger说:“随着整个汽车行业都在向电动汽车发展,电力存储仍然是目前的限制,理想情况下,这样的芯片需要尽可能低的功耗。”“所以效率——每瓦的性能——是非常重要的。如果你把硬件放在数据中心的云端,情况就大不相同了。使用水冷系统和诸如此类的系统没有问题,但对于生产使用的汽车来说,功耗是首要考虑的问题。”

成本控制
问题是,要实现3级及以上的自动驾驶,需要大量的传感器,而强大的计算平台位于中间。这增加了汽车的价格。“如果你想超越更容易隐藏成本的高档汽车,你就需要考虑如何降低这种系统的成本。因此,它将不是一个水冷系统,它将是一个消耗,比如说,小于100瓦的系统。这是一个挑战,”Schweiger说。

在汽车市场上,价格是一个非常大的考虑因素。“他们正在与每一分钱的零头作斗争,”Peter Greenhalgh说,技术副总裁和研究员手臂.“不可避免的是,他们会把所有的芯片都焊到PCB上,但你不能只是拿起一个,然后再放一个进去,因为这个插座会多花10美分,他们无法证明这是合理的。”

在车辆中设计一个强大的集中式计算系统是具有成本效益的,因为设计可以一次性开发,并在多个车型中使用。“从根本上说,CPU、GPU或机器学习处理器的微架构并没有发生重大变化,”格林哈尔说。“如果是在汽车行业,你会把功能安全放在首位,如果是在基础设施市场,你会把更大的物理地址放在首位。显然,在微架构中有一些部分必须处理更大或更小的工作负载。但从根本上说,这些区块的微观架构并没有突然改变。”

因此,虽然这些设计很昂贵,但开发成本可以分摊到许多车辆上。Synopsys的DiGiuseppe说:“一般的半导体行业专注于16/14纳米工艺,并向7纳米发展,但当你在汽车领域采用集中处理的高性能计算架构时,这包括大量的重处理和多个应用程序同时在每个应用程序中运行。”“现在我们谈论的是一款性能更高、多核的5nm级设备。”

不过,这项技术在其他应用中已经得到了广泛的应用。“任何高性能计算应用的计算需求都是相似的——即,大量的数据和复杂系统建模的细颗粒模式分析——而汽车并不因为它是在轮子上就有所不同,”凯文·麦克德莫特(Kevin McDermott)说治之.“实时和混合临界方面非常重要。在任何多阵列处理器配置中,处理元素的交互都需要软件优化,这些优化依赖于程序员的工具来调试和分析复杂的多核事件序列。虚拟平台提供了硬件原型无法实现的事件场景的洞察力和可控性,允许在故障模式条件下进行广泛验证,这对安全关键和安全需求非常重要。”

有什么不同
不过,汽车行业确实为高性能计算设计增添了一些新的花样。数据中心应用程序具有附加的安全层,包括物理墙和安全警卫。相比之下,汽车与消费设备有更多的相似之处。永久连接,包括空中更新,扩大了黑客的攻击面,这需要对系统健壮性进行持续测试。他指出,用于安全测试的虚拟平台允许独特的访问方式来探索意外事件情况,以对内部防御进行压力测试,这些选项很难用物理原型进行测试。

McDermott说:“混合临界是嵌入式应用程序中常见的多核设计挑战。“随着越来越多的功能组合在共享硬件资源上,单独区域的故障可能会危及高优先级和/或安全功能。随着知识产权和软件供应商以及新的服务提供商和IT基础设施的增加,汽车供应链正在不断发展。在多层方法中,每个阶段都可以添加附加软件作为增值。这导致了一个复杂的软件维护和更新过程。虚拟平台可以作为汽车高性能计算的数字双胞胎,允许供应链与多维持续集成持续部署的参考平台统一,因此硬件功能范围和不同的软件版本和更新可以用作虚拟回归农场。”

不过,这需要一些强大的处理能力,以及使用多核架构同时运行不同操作的能力。在单个SoC中看到多个12位64位多核独立处理器内核并不罕见。

DiGiuseppe说:“对于ADAS域控制器来说,就像区域架构中的中央处理器一样,它是一个多芯片实现。“可能会有一个高性能的5nm主处理器,但即使这样也可能无法处理所有的性能,所以可能会有一个协处理器,可能还有一个集成的人工智能加速器。在深度学习AI加速器上安装额外的外部芯片也很常见,所以即使现在我们看到多个芯片实现了adas级的域控制器,这将开始看起来更像一个更传统的基于hpc的数据中心设计,应用程序集中,多个应用程序并行运行,虚拟操作系统,管理程序和分布式异构架构,看起来很像数据中心的服务器。”

对于刚刚开始瞄准汽车市场的加速器芯片公司来说,这简直是天籁之音。公司首席技术官Zdenek Prikryl表示:“我们看到人们对在人工智能应用中使用RISC-V很感兴趣。Codasip.“这包括欧洲处理器计划特别是在汽车领域,有很多选择都涉及到功能安全。”

加速器可用于加速不同类型数据的处理,如流媒体视频、振动和温度,并可提高整体系统性能和反应时间。

处理、网络、存储的差异
DiGiuseppe表示,汽车领域的HPC与数据中心领域的HPC非常相似——这是另一个对处理、网络和存储有独特需求的领域。“在数据中心,你通常会分解处理、网络和存储。在汽车领域,它们具有相同的功能——中央处理、网络和区域网关,其中包括网络和片上存储。汽车领域的主要区别在于,它更像是一个端点设备,而不是一个数据中心。一个数据中心可能有10,000个服务器,所以所有的东西都有更大的规模。这是相同类型的设计,但性能不太一样。数据中心的网络端将有200/400/800 Gbps以太网,有tb级的硬盘驱动器和ssd,用于非常低延迟的存储,而汽车网络可能是10 Gbps,而不是200或400 Gbps。汽车可能趋向于25gbps。这是同样的挑战,但在不同的表现点。”

在处理器端也有类似的情况。“数据中心中的英特尔至强服务器可能有一个12核英特尔处理器,主板上有四个处理器。数据中心的情况与汽车行业类似,都是异构的多核架构,可能有1000台服务器,应用程序都是虚拟化的。汽车行业也面临同样的挑战,只是规模缩小了一些。没有数千个处理器内核。你面临着同样的性能挑战,但规模不同了。”

软件架构
就像在数据中心一样,软件架构也需要被很好地定义。汽车领域的虚拟化环境需要完美的架构,因为在异构架构下,虚拟化的应用程序必须分布在多个核心和/或多个soc / ecu上。

Synopsys汽车集团高级经理Chris Clark解释说,在数据中心中,有高冗余以确保工作负载的完整性,而在汽车中,出于安全原因需要冗余。“最终,你仍然会遇到高速互连的挑战,以确保你所服务的不同领域和计算平台具有必要的计算能力,但在某些情况下也要解决安全性、安全性和延迟问题。它们非常相似,但也有一个权衡。当我们的资源有限时,我们必须确保这一点。在数据中心中,可能有1000台服务器。每天都有两三个人辍学。在汽车内部你没有这种灵活性,特别是当你看到一个集中的计算平台时。因此,关于虚拟机管理程序和虚拟化的概念和想法是至关重要的。”

对于设计团队来说,汽车领域对高性能计算技术需求的敏感度需要高于数据中心领域。

Clark说:“如果你看看高性能计算数据中心,你可以四处走走,进行技术转换。”“也许核心网络基础设施并不一定具有与核心数量相匹配的带宽,但你可以在物理上进行切换。从汽车的角度来看,所有这些都被缩小到一个位于一平方英尺内的单一SoC。你必须处理所有的冷却要求和所有的可靠性部件,比如振动。你的SoC会因为高温而分层吗?所有这些你在传统数据中心不会考虑的事情现在都必须考虑,所以对组件、基础设施的外观以及来自OEM的要求有了更多的敏感性,以确保我们能够从计算和功耗的角度满足这些要求。”

汽车高性能计算的可靠性也与商业数据中心的可靠性有很大的不同。DiGiuseppe说:“在汽车领域是不允许出现故障的,而在数据中心,你必须预料到它,如果发生故障,会自动故障转移到另一个服务器。”“在汽车领域,灵敏度体现在长期运行、高可靠性、功能安全性和零缺陷设计的设计方法上。这就是设计技巧。”

软件也是如此。在传统的数据中心中,裸金属管理程序被架构到系统中。尽管这些管理程序非常轻量级,但它们控制着对底层硬件基础设施的所有访问和理解,并为位于该管理程序之上的操作环境执行规则。其他虚拟化场景包括包含核心操作系统的体系结构,甚至包括成熟的操作系统,但随后它被划分为基于该平台的不同虚拟化环境的小计算域。这些方法在HPC数据中心中以不同的配置使用,具体取决于它们试图实现的目标。

虚拟化和虚拟机管理程序在汽车方面有不同的考虑。Clark说:“你必须确保你的SoC设计同时支持这些管理程序和虚拟化环境,并且以一种安全可靠的方式支持它们。“在车辆中,如果有两台服务器和一台崩溃,如果其中一台服务器实际上是一个虚拟环境,它是制动控制器,那么重新启动虚拟化环境所需的时间可能具有在高性能计算环境中看不到的特定要求。能够重新启动这些服务,并以适当的方式重新启动它们,这对于围绕功能安全的概念非常关键,而传统数据中心HPC环境中并不存在这种概念。在这里,它说在某些故障情况下,必须通知司机,或者必须降低车辆的能力,以确保车辆以已知的安全方式运行。对于汽车体系结构中的管理程序和虚拟化,必须做出一些决定,即在该领域体系结构中,车辆中的哪些类型的功能适合包含在管理程序或虚拟化环境中。在高性能计算数据中心环境中,这通常不是一个讨论,甚至不是真正的核心焦点,因为你有更广泛的机会进行更改,让你的数据中心更灵活地满足你的需求,这取决于你想做什么。”

在设计这些汽车soc时,有一个非常具体的操作需求范围,以及管理程序将如何操作,以及管理程序可能看到的预期活动。如果包含虚拟化,则需要指定虚拟化的组件。

Clark指出,在信息娱乐中心中加入虚拟化是有意义的。“如果我有新功能,我会使用容器化和虚拟化,我想要执行更新。与通过空中进行软件更新相比,通过空中进行容器或虚拟化环境的交换可能要容易得多。这要视情况而定。这是目前正在与一些原始设备制造商进行的讨论之一。关于如何处理软件更新以及对区域架构的影响的新标准正在出台。”

这类决策对于车辆芯片架构至关重要。Cadence设计IP营销总监Tom Wong表示:“解决计算需求的限制因素是吞吐量,在数据中心,吞吐量来自于服务器的计算性能和特定任务的工作负载优化。”“在汽车领域,目前的工艺节点选择是16nm。然而,从计算的角度来看,你已经耗尽了精力去尝试做很多这些AI优化。16nm芯片的速度还不够快,而且在实现芯片方面的计算资源将会非常大,以至于晶圆成本将会过高。16nm的模具尺寸可能太大,功耗剖面不适合汽车。这些成分正在推动向更精细的几何图形的移动,就在我们说话的时候,这正在发生。但我们可能要到2022年或2023年才能看到7nm或5nm的汽车硅,这取决于工艺。”

高性能内存的考虑也开始发挥作用。这些问题仍在解决中。在可靠性方面,机械组件预计可以使用12年不出现故障。此外,随着汽车制造商为汽车添加越来越多的自动驾驶功能,所有这些都必须完美无缺。

“越来越多的人工智能推理将处于边缘,它将在汽车内。这为传感器分析增加了大量的人工智能计算,从而实现寻路和路径预测,而这些计算将在汽车中完成。”

考虑到整个人工智能市场的38%是汽车,而对人工智能应用要求最高的是汽车内部,Schweiger指出,看看人工智能是如何被分割和切割的将是很有趣的。“多核配置中需要可扩展的硬件加速器,以实现更高性能的AI操作,但较小的部分仍然使用一个单元。这意味着人工智能的可扩展性非常重要。这也很有趣,因为随着人们学习如何利用人工智能,它在未来只会变得越来越重要。”

相关的
移动汽车架构
当汽车是围绕数据移动设计的时候,会发生什么变化呢?
汽车设计新方法
原始设备制造商使用基于模型的系统工程转向可执行规范。
半导体工程的汽车知识中心
顶级故事,视频,博客,白皮书和技术报告的汽车
自动IC更新的好与坏
复杂的电子设备和更长的寿命将需要更严格的供应链管理。
汽车工业正在改变
汽车电子产品正变得更加集中、互联和复杂,整个供应链正在围绕这些转变进行调整。
互联汽车将迎来巨大变革
要接入汽车内外的多种服务,就需要重新考虑从架构到安全的方方面面。



2的评论

斯科特•菲利普斯 说:

当这些联网车辆四处漫游,与周围的一切进行通信(可能相当混乱)时,安全计划是什么?似乎应该在车辆和端点中内置一些机器对机器认证或类似区块链的标准。

Ann Steffora Mutschler 说:

嗨,斯科特,我猜会使用多种方法,但安全肯定是最重要的。很难说这个计划是什么,因为目前还没有任何行业标准被采用,这肯定会有所帮助。许多工作仍在进行中。我在努力掌握最新进展!

留下回复


(注:此名称将公开显示)

Baidu