18.luck新利
的意见

发现热点地区人工智能芯片

考虑在决定去哪里热监测传感器芯片上。

受欢迎程度

事情变得更复杂,我们向下移动7和5 nm的公差的一些生理效应,过去我们一直测量比他们年长的节点严格得多。我们如何跟踪所有?

我们看到的是,当我们下通过先进的节点,从16 nm 12海里,7和最近5 nm,我们看到门密度开始影响许多地区的动态芯片的情况而定。通常,有更多的热点地区,他们更本地化的,有一点变化的供应也挑战整个设备的过程的可变性。

为了测量这些变化在动态条件下您需要决定下落在设备上您要监视这些动态条件和方差。当然,有法律或规则,说只要你想监视你正在取代一些固有的信息在你试图衡量放在第一位。

人工智能芯片的典型类型的安排有一个多核架构的总体结构,可以从一个数据中心规模差异非常大人工智能芯片相比更边缘的东西,也许在汽车。

往往发生在一个典型的人工智能芯片,这些总是在你移动数据通过在非常高的速度。这使得监控温度差异在芯片相比,更重要的是一个小设备,它只是打开或关闭。条件更极端,我们找到的一件事是你可能多cpu,多核体系结构和它可以由数百,甚至成百上千的核心。往往会发生什么是工作负载非常丛发性他们运行算法和执行计算,我们看到有通常情况你都无法提供足够的权力核心操作一次。因为你从来没有达到100%的利用率,充分利用权力,你可以提供到设备。

本质上我们看到的是负载平衡整个芯片,需要发生动态变化。如果你开始有不均匀的负载平衡和工作负载可以导致压力的核心领域的芯片在工作,主要是由于某些地区时生成的热量的芯片在活跃。

当把芯片上的监控是很重要的,首先,要考虑你正在与重复的结构,所以可能多核集群内分组。你会看到的是监视器放置每个集群然后重复这些监视器的位置以及集群。变得非常均匀,也使得设计团队和那些做地板计划处理的重复特性监测位置。

有时这些设备加热,因为硅热电导率的芯片可以飘过。之后的时间会有一个热耗散或热流经硅,毕竟硅设备和硅本身很薄,这样漂流不可避免地发生。但是,我们也看到有趣的形式我们的客户群,你实际上得到热点,也许20到30度高于其他领域的芯片,这是很重要的。

如果我们谈论精度,它是非常可取的整个被监控热死,当然有一个开销任何传感器放入芯片,所以你必须能够分发他们仔细的细粒度的方法。你需要意识到将会有之间的距离内实际热点所在芯片和特定的核心工作相比,传感器实际上是放置的地方,所以可以有一点之间的相关性要求,热点和传感器的位置。

而言,传感器的地方以确保你得到一个准确的阅读很少有工具,可以作为开发流程的一部分,基本上良好实践。有很多热分析工具,当他们已经在芯片运行不同的工作负载和不同的软件,不同的活动的概要文件,您可以开始看到热点在哪里,可以给你一些一般性的指导热传感器的位置。也常常可以下降到地板上规划和哪里有可用空间,但是通常我们建议你把传感器接近核心的核心和最高密度分组。

计划监控的位置是很重要的,在设计的早期的最大化他们的能力的体系结构。也许这都是深谋远虑远期规划和使用的仿真工具,以帮助您在设计流程。

有趣的关于人工智能体系结构,取决于他们是如何开发和设计,大规模的数据中心环境设计可以很大要也许分划板的尺寸和图纸数百瓦的功率。另一方面,你可以把AI边缘,它被应用于汽车意味着服务器级系统实际上被放置在汽车本身。显然他们不得不缩减规模,还必须考虑设备的寿命,达到10,15年,甚至20年寿命在汽车方面,而在一个数据中心设备/技术可能只持续3到4年。

如果你有AI设备在数据中心环境中,因此设备是相当大的,当然是在输入插口的供应水平可能不是在同一水平的中心芯片,所以你有IR降效应,并试图监控是一个相当有趣的区域。动态问题IR降尤其相关的人工智能应用程序和人工智能架构,因为丛发性本质的核心是利用意味着你可以得到高需求,很快,在尖峰电流到设备,然后向下拉的供应。这导致下垂在供应,可以相当重要的试图监视和捕获,这样您就可以补偿的电压调节器,在第一时间提供芯片。

在芯片的寿命和它的功能如何,我们分类为两个领域。有动态的监测条件,生活条件,取决于什么样的活动概要文件在设备上,还有静态条件下基于芯片是怎样制成的,建在条件相关监测。



留下一个回复


(注意:这个名字会显示公开)

Baidu