18lk新利
的意见

没有两片薯条是一样的

利用深度数据分析来抵消芯片的可变性

受欢迎程度

随着半导体工艺的不断缩小,管理单个器件的参数变得越来越具有挑战性,不仅是晶圆直径,而且是单个芯片的长度,特别是对于面积较大的复杂芯片。目前解决这个问题的标准方法是假设最坏的情况,并创建一个容纳最坏可能情况的次优设计。现在不需要再这样了。

片内变异(OCV)是什么意思?
薯条就像雪花一样。在给定的芯片甚至晶圆上,期望每个设计相同的晶体管都具有相同的性能是很正常的。毕竟,它们都是在同一时间以相同的方式处理的,所以为什么它们的特征会有所不同呢?但事实上,这些看似相同的晶体管有很多不同的原因,就像雪花一样:尽管它们可能一开始看起来是一样的,但仔细观察就会发现没有哪两个是一样的。这种现象被称为芯片变异(OCV),它是由几个因素引起的。

过程变化
在理想的情况下,所有的半导体工艺在整个晶圆上产生一致的结果。这不仅包括工艺几何,随着工艺收缩,必须对其进行越来越严格的公差设计,还包括掺杂浓度和薄膜厚度,以及其他工艺。想象一下,在300mm直径的晶圆上保证2nm±4%的薄膜厚度是多么困难。

半导体设备制造商Lam Research举了一个例子,说明晶圆上的一个工艺如何不同。

图1:等离子蚀刻中跨晶圆均匀性控制。来源:Lam Research

颜色梯度说明了晶圆上数百个工艺中的一个的变化,主要是因为从晶圆边缘到中心(同心圆环)的工具性能的差异,但也有其他因素导致了不规则形状。Lam指出,即使是工具相对于磁北的方向也会在等离子蚀刻过程中引起不规则现象。

此图像表示单个工具和单个过程。一块半导体晶圆是用一百多个这样的工艺制造的,所以最终的结果是晶圆上有一百多个这样的图案。这意味着晶圆表面的每一个晶体管都有充分的理由表现得与数十亿个晶体管中的任何一个不同。

虽然这篇文章的重点是晶体管,但其他电路元件也将受到影响,包括电阻,寄生电容,甚至互连

这片晶圆上的单个芯片将包含图像中不止一种颜色,可能跨越绿色、黄色和橙色区域。一个更大的芯片将有一个更大的期望变化。这意味着晶体管性能将变化,甚至在单个芯片由于这些工艺的变化。设计相同的晶体管可能会比另一个慢或快,或者漏频或漏频少。

环境变异
过程变化只是故事的一部分。除了OCV,其他方面也会影响高级集成电路的变异性。芯片本身并不是一个统一的工作环境。芯片的不同部分会比其他部分消耗更多的能量,从而导致芯片内部出现热点。在芯片设计过程中,这是一个重要的考虑因素,布局工程师尽最大努力使整个芯片的散热均匀。虽然这些工程师在一些令人惊叹的CAD工具的帮助下做了出色的工作,但永远无法达到完美的平衡。预期的工作温度可以由CAD程序绘制成热图,热图使用颜色表示哪些部分将运行得更热(红色),哪些部分将运行得更冷(蓝色)。


图2:热图示例,由布朗大学SCALE实验室

很自然地,如果一个在红色区域,而另一个在蓝色区域,两个相同的晶体管就会彼此不同地工作。

这些区域不是静止的——热点会根据正在执行的操作类型而移动。考虑一个微处理器芯片:如果它正在执行信号处理,这需要大量的乘法-加法运算,那么芯片的浮点单元(FPU)将进行大量的计算并消耗大量的功率,因此热点将在FPU附近。在其他时候,处理器可能会停止进行信号处理,并开始对数据进行排序。在排序过程中,处理器所做的只是将数据移动到芯片中,偶尔检查其值,然后将其移动到外部内存中的另一个地址。热点将从FPU转移到芯片的接口部分,在那里输入和发送数据。

随着热点在芯片上的迁移,我们的两个晶体管将看到移动的工作环境:首先晶体管A是冷的,而晶体管B是热的,然后晶体管B将变冷,而晶体管A变热。由于没有办法监测这些条件,也不知道每个晶体管对温度变化有多敏感,芯片的设计必须适应绝对最坏的情况:设计师必须假设晶体管在承受很大范围的未知温度时,性能在整个性能范围内都是不同的。在proteanTecs引入一种在每个芯片内部深度监控芯片性能的方法之前,这是业界最著名的做法。

衡量这些差异
如果设计人员能够了解单个芯片中特定区域的性能,那么设计就可以适应差异并提供最佳性能,而不是为绝对最坏的情况而设计。

这就是深度数据芯片遥测技术的用武之地。proteanTecs使用被称为“代理”的微型测量电路来监测芯片的健康状况和性能,这些测量电路被嵌入在芯片中,靠近它们所监测的电路。这些代理足够小,可以广泛分布在战略位置附近的整个芯片上,而不会增加芯片的尺寸和成本。然后,他们将测量结果报告给proteanTecs分析平台,在该平台上,机器学习算法提供全面的评估,可用于调整该芯片部分的性能。这使得制造商可以更清楚地了解芯片的运行情况,从而更好地控制芯片的性能。

例如,在一个多核芯片中,可以允许一个核运行得更快,而另一个核将基于这种新发现的可见性被抑制。这意味着整个芯片不需要像通常使用当今最知名的方法那样,在绝对最坏的情况下一直保持戒备状态,并且可以在不增加成本或功耗的情况下获得显著的性能提升。

这种方法提供了一些重要的优点:

  1. 由于代理在芯片中广泛分布,它们可以捕获关于整个芯片以及芯片内多个块的数据。然后,芯片制造商可以在生产和现场操作期间,了解多个战略位置的实际变化情况。
  2. 代理在几个维度上测量数据。它们被设计用来测量目前最知名的方法无法捕捉到的现象(例如泄漏),其中大多数方法只关注延迟。
  3. proteanTecs提供了OCV和其他可变源如何影响整个芯片的性能的见解。这种变化源于过程吗?热梯度?别的吗?它如何影响芯片性能的不同方面?

从测量到洞察
下图取自proteanTecs的先进的分析平台,代表整个晶圆,分解成单个芯片。每个芯片都覆盖了高覆盖率和广泛分布的代理。


图3:颜色显示了一个Agent的测量值如何与同一芯片中所有相关Agent的平均值进行比较,并显示在晶圆图上。

用户可以选择在分析平台中查看哪个Agent或参数,以获得全面和整体的方法。


图4:单个芯片的详细参数视图,广泛分布的圆点表示嵌入的agent。红点表示所选参数的值显著低于平均值的agent,绿点表示显著高于平均值的agent。平均的点是橙色的,其他颜色表示这些水平之间的值。

深度数据芯片遥测技术提供了无法通过其他方法测试的操作参数的可见性。这些都是与芯片和晶圆的相同参数进行比较,以提供有关这一芯片与同类芯片相比如何预期执行的有价值的见解。现在,芯片制造商需要找到补偿变化的方法,以提高芯片的性能和可靠性。

谁从中受益,如何受益?
这类信息对于在新产品引入阶段描述新芯片设计的工程师来说是无价的。这个团队非常清楚地了解芯片的可变性,这有助于他们理解芯片的操作。然后,如果问题源于工艺参数,他们可以将这些信息反馈给工艺工程师,或者如果需要进行设计调整,则反馈给芯片设计团队。这将有助于整个公司提高产量,并在整个芯片上实现更统一的行为。这种高水平的测量分辨率创建了跨团队的协作,因为他们正在努力解决已理解的问题,而不是猜测问题的原因。

持续可见的变化还有助于工程师确定特定的芯片是否可能发生现场故障,以及某些电路是否比其他电路更容易导致故障。这使得合格工程师可以了解芯片的某个部分是否需要重新设计。深度数据有助于识别潜在的问题区域,从而做出更明智的决策,从而减少或消除现场故障。

在设备进入生产后,系统级或应用级设计人员可以使用相同的方法来更好地决定如何使用芯片。他们现在可以深入了解芯片变化到底有多强,以及它在实际应用中如何影响芯片的性能。

结论
先进的工艺会导致显著的芯片变化,这是目前的标准技术无法充分测量的。内置高覆盖深度数据遥测技术的先进芯片可以揭示其内部性能的高分辨率,以及这种变化是如何影响的。有了这些数据,芯片设计师可以改进他们的设计来补偿,工艺工程师可以改进他们的工艺来减少OCV,应用工程师和系统设计师可以调整系统,不仅可以提高性能,还可以在潜在故障发生之前获得可视性。



留下回复


(注:此名称将公开显示)

Baidu