限制人工智能系统的能力

开发这些系统只是挑战的一部分。确保他们只做他们应该做的事情可能更难。

2021年4月22日-到:埃德·斯珀林

新的技术和方法开始应用于人工智能和机器学习，以确保它们在可接受的参数范围内运行，只做它们应该做的事情。

近年来，让AI/ML/DL系统工作是技术上最大的飞跃之一，但了解如何在它们适应的过程中控制和优化它们还远远不够。如果在现场出现问题，这些系统通常是不透明的。对于如何利用算法，或者决定算法行为的权重将如何随着特定用例或与其他技术的交互而改变，很少或根本没有可见性。

事实上，欧盟本周发布了指导方针人工智能——具体包括机器学习和自动决策系统——限制这些系统自主行动的能力，要求“安全可靠的系统软件”，并要求确保“人工智能系统及其结果”的责任和问责机制。

关注的程度在很大程度上取决于设备应该做什么，它被使用在哪里，它连接到什么。例如，在一些消费电子应用中，这可能是一个次要的考虑因素，但在控制它们的网络中，这可能是一个更大的问题。

“问题是人工智能在哪里，”该公司高级副总裁兼电力与传感器系统业务部门CTO Sandro Cerato说英飞凌科技．“因此，云端有人工智能，物联网边缘也有人工智能。最后，有许多人工智能，它们根据所处的位置具有不同的功能。我现在可以和我的吸尘器交流，它连接到一个网络上，这个网络的一部分是非常智能的。

安全和关键任务应用是一个特别令人担忧的问题，特别是随着汽车、无人机和工业机器人的自主性水平不断提高，以及机器对机器学习被用于更新这些系统。

Mythic的工程副总裁Ty Garibay说:“挑战在于神经网络的不可逆性或黑箱性质。”“它是如何做出决定的?”人工智能的统计性质也带来了挑战。它可以是正确的。如果你把一张猫的图像放在一个特定的神经网络上，这个神经网络经过训练，可以判断它是狗，那么它每次都会说猫是狗。这对数字处理器上的神经网络来说是正确的行为，但却是错误的答案。”

解决这些问题是困难的，而人工智能系统应该适应的事实使其变得更加困难。挑战在于最大限度地减少这种适应所造成的附带损害。

总的来说，遏制人工智能的策略可以分为以下几个方面:

有限的功能。如今，确保人工智能系统不会偏离太远的最常见策略之一是在几个不同的人工智能处理器或系统之间划分功能，而不是只依赖于一个，并为关键任务或安全关键功能添加冗余。
更好的模拟。在设计周期的早期了解设备如何与其他设备交互是开发这些系统的公司的主要关注点之一，但这需要专门的模拟器具有足够的能力来包含多个元素，这增加了成本。
实时监控。无论是由于传感器漂移、算法缺陷还是其他硬件缺陷，当设备偏离其合法操作时进行跟踪，都是对芯片级和系统级可靠性日益关注的另一个方面。
算法的更多可见性。编写算法的新方法已经开发了好几年。到目前为止，这些工作仍在进行中。

对许多公司来说，限制功能显然是第一步。Xilinx的智能网络接口卡可以适应多种实现和连接选项。三星的HBM内存提供了一种AI芯片，基本上解决了同样的问题。许多EDA工具和芯片制造设备都添加了某种类型的机器学习(人工智能的一个子集)，以识别模式和潜在问题。

下一阶段将更加困难，它需要对系统将如何使用和施加压力，以及人工智能将如何适应各种操作条件和其他变量有更深入的理解。在某些情况下，这可能需要一个数字双胞胎或类似于航空航天工业多年来一直使用的冗余水平，即比较三个系统的结果，并使用最接近的两个。

“控制人工智能的最佳方式是建立第二个系统，充当安全控制机制，就像我们今天在硬件或软件上为功能安全所做的那样。OneSpin解决方案．“你想防范哪些东西?”你不想让AI做什么事情?你想要捕捉哪些糟糕的情况?你想要降低这些风险。你不能完全控制人工智能，因为它太复杂了，但你可以降低风险。如果我们能提出一些方法和标准来解决这个问题，那将是有帮助的。这可能包括每个人都想检查的准备好的场景。”

这在很大程度上是基于对这些设备将如何使用的预测。芯片设计团队通常没有这些信息，因为他们是根据规格进行设计，无论是单个芯片、封装还是子系统。但有时，即使是垂直集成的系统供应商也会对其设备的运行环境感到惊讶，因为他们周围的技术变化得如此之快。

“你在设计阶段做了一些假设，但你不知道这些假设在部署阶段是否正确，”阿里巴巴战略和业务发展高级经理Anoop Saha说西门子EDA．“当iPhone被部署时，你不知道它会被用来上传这么多TikTok视频。这发生在设备投入生产之后，它完全改变了利用率。这也需要一些可配置性，所以你也需要把它放到SoC中。”

设计注意事项
AI/ML主要集中在针对特定用例或硬件配置优化系统，提高性能和/或降低功耗。但并不是每个设计团队都能访问相同的数据池，这使得这变得更加困难。在许多竞争激烈的市场，以及从设计到制造链的许多环节，这些数据都是高度专有的，这使得设计和控制人工智能更加困难。

“因此，我们缩小了网络，并对问题的结构进行了格式化，以便它们更好地映射到现有的硬件，无论是CPU、GPU还是NPU，”ibm的技术主管兼研究员罗布·艾特肯(Rob Aitken)说手臂．“但无论硬件是什么，它在某些操作上会比其他硬件做得更好。让你的问题适合硬件总是降低功耗的好方法。从长远来看，如果有一堆应用程序不能很好地适应特定的体系结构或体系结构集，我们如何设计更好或更新的应用程序?这就是空间计算的用武之地。很多项目都受到了这样的限制:‘你有为这个项目定义硬件的自由吗?或者你使用的是特定的硬件平台，在这种情况下，你需要调整你的系统，以适应它的局限性和功能。但如果你可以定义硬件，那么你就有更多的自由度，可以做更多的事情。”

对系统所有部分的访问越多，数据就越多，结果也就越好。但是有如此多的数据和如此多的可能的交互，系统级的模拟变得必不可少。这里的挑战是一些需要模拟的系统的规模和复杂性。另一方面，分段进行这种模拟的价值有限，因为在日益复杂的系统中，理解尽可能多的交互是必不可少的。

“这不仅仅是因为这些电路更大更复杂，”该公司产品管理和营销集团总监哈尼·埃尔哈克(Hany Elhak)说Synopsys对此．“现在我有很多不同类型的电路，它们是这个更大系统的一部分，它们需要一起设计。然后，我们需要为这些不同的设计团队制定一些共同的流程，这样他们在设计周期结束时，当他们试图将这些东西连接在一起时，就不会出现问题。他们需要从一开始就合作。”

人工智能在此基础上增加了另一个元素。从芯片设计的角度来看，AI设计，或包含AI元素的设计，需要像任何其他芯片一样发挥作用。人们经常不了解的是，这些设备在适应后将如何表现。

OneSpin的布林克曼说:“对于人工智能来说，你在芯片上产生了许多非常相似的元素来并行执行，但与无序处理器相比，这些元素本身相当简单。”“AI矩阵中的处理元素相当小，易于理解，也易于验证。这是我们今天所拥有的技术可以控制和做到的。更大的问题是什么在上面运行，那就是软件。这就是人工智能的实际验证问题所在。”

规模只会让问题变得更糟。Synopsys的Elhak说:“其中一些人工智能芯片是非常大的数字芯片，需要使用基础ip进行设计，它们需要与设计中的其他模块通信，比如高速I/O和内存接口，所有这些都需要精确而快速的模拟。”“为了实现人工智能，模拟器确实需要比现在做的多得多。你需要模拟所有这些来验证这些人工智能芯片。”

生命周期监视和度量
这只是起点。有了人工智能，持续的监控是必要的。

“由于这样或那样的原因，模型漂移是一个真正的问题。关于测量漂移和找到控制漂移的机制，有一个完整的研究领域，”IBM人工智能计算主管杰夫·伯恩斯(Jeff Burns)说。“我们的很多关键客户都在受监管的行业。他们需要对做出关键决策的原因进行审计。由于这些客户是谁，这包括整个人工智能生命周期。”

这要求通过某种循环系统对数据进行结构化、组织化和模式筛选。

布林克曼说:“学习、再学习和再培训都是在工厂里进行的，而不是在边缘地带。”“它可能会结合来自不同人工智能系统实例的不同输入，但本质上你必须有一个数字双平台监控，并有一个清晰的认识。想象一下，如果你有一个系统舰队，你想升级一个传感器。有些系统可能有更新的版本，因此它们提供的数据与旧版本不同。把所有这些重新组合成你可以使用的东西需要你跟踪那里有什么。这是一个层面上的配置管理，但你也可以把它看作一个数字双胞胎。你在工厂里有一个所有这些系统的模型，你可以模拟如果你在实际操作之前上传一个新版本会发生什么。”

实际上，它是一个随着系统进化而移动的参考点。它解决的挑战是如何为人工智能的行为提供某种程度的解释。

微软分布式数据处理和控制部门主管Dirk Mayer表示:“这是我们目前正在研究的问题。弗劳恩霍夫IIS的自适应系统工程部。“这是一个非常重要的话题，因为一些东西需要通过认证。如果你想使用人工智能算法，要离开原型阶段，你需要得到客户的认可。所以你需要一个经过认证的故障率或者其他工业系统都有的数据。我不确定目前的人工智能算法是否满足这些要求。另外，你也没有那些算法来预测它们是否能满足要求，这是一个转移问题。对于这个应用程序和特定的机器，您可能有一些可以工作的东西。你可以用真阳性率和假阴性率来预测失败。但当你把算法转移到另一台机器上时，你必须从头开始分析一切。”

利用数据
另一个相关的挑战涉及人工智能系统中需要考虑的来自不同学科的因素越来越多。

“架构一直在变化，”Tensilica AI产品的产品营销总监Suhas Mitra说节奏．“有很多研究正在进行。但有没有什么方法能让这一切万无一失呢?答案不是很清楚。您需要了解所有这些，并拥有一个能够快速有效地完成所有这些工作的软件工具链。然后你需要回到硬件-软件协同设计方法，并问自己，‘如果我使用这个新的网络，我需要如何改变我的硬件?关于激活函数，我现在要做什么，如果我做一个3D和2D MAC数组会发生什么?所有这些不同的因素都起着作用，解决方案可能取决于你关注的领域。”

米特拉说，这些领域决定了任何变化的关键程度，有两个因素需要考虑。“一个是变化方面的时间效应。不同的垂直行业有不同的需求。这一切都归结为功率、性能、面积和带宽。您需要分析网络，并确定软件工具链中需要哪些改进来满足这些需求，然后确定我们需要如何调整硬件。或者我们可以在硬件上做一些不同的事情来更好地利用这些东西?同时利用两个轴是非常具有挑战性的。”

这反过来又影响了这些系统如何适应，这里的大问题是有太多可能的排列需要跟踪，通常跨越多个工程学科。

“机器学习更像是数据工程，而不是算法优化，”西门子的萨哈说。“你如何消毒你的数据?你如何判断哪些数据是重要的?如何压缩数据，只保留重要的部分?这可能是机器学习的核心。目前在每个领域收集的数据量都是巨大的，我们无法快速或静止地处理这么多数据。”

这里的关键是理解哪些数据要保留，哪些数据要删除，以及这些数据如何因人工智能系统的变化而变化。这在语音或图像识别中更容易做到，在这些领域，糟糕的结果显然是错误的。但要处理与即时结果无关的数据就困难得多。准确性并不总是显而易见的，传感器漂移及其对结果的影响等问题可能需要更深入地了解这些系统是如何变化的。

萨哈说:“我们在说话、听说话和视觉方面所做的，都是受我们眼睛和耳朵的限制。”“我们的眼睛关心什么?在此基础上，主要功能是什么?我们的耳朵对什么东西敏感呢?但随着我们将机器学习的用例扩展到不同的领域，这将变得更加困难，也是一个有趣的挑战。”

图1:显示每瓦AI芯片计算能力随时间增加的趋势线。来源:IBM

未来
虽然到处都在大肆宣传智能，但在关键功能方面，公司都在谨慎地推进。到目前为止，大部分工作更多地集中在人工智能的子集上，而不是推动完全自主机器的发展。

“作为一名研究生，我的办公室旁边有一个人，他后来成为了欧洲人工智能领域的顶尖教授之一，现在他已经退休了。治之软件．“他的结论是，要获得真正的情报需要很长时间。机器学习是另一回事。机器学习有助于数据分析和更好地预测。我喜欢我的车在我前面减速时会稍微踩刹车。这是后天习得的东西，但并不是真正的智力。我们在汽车行业的一个客户使用模拟来分析您的汽车的速度。他们可以查看汽车车轮的ABS数据，并告诉你你的轮胎是否在下降。这是智力吗?还是说它只是用了很多聪明的算法进行分析?”

这种区别对这些系统正在解决的问题有很大的影响。大卫曼说:“一些机器学习的东西可以容忍小范围的故障，比如汽车中与缓存有关的比特翻转。”“到现在为止，你可能会认为我们知道如何做这个或那个。我们没有。但现在的情况正呈爆炸式增长，对电子行业来说，这将是一个非常有趣的时期。”

对于AI/ML设计来说，挑战才刚刚开始。

相关的
确保AI/ML在测试系统中工作
人工智能有望提高可靠性，但还不完美。
人工智能的新用途
功率和性能的巨大改进源于低水平的智能。
如何测量ML模型的准确性
对一个应用程序足够好的东西可能对另一个应用程序不够。
验证网络物理系统的巨大挑战
与会专家:模型和标准很少且不充分，这使得很难考虑硬件-软件和系统级的交互以及物理效应。

埃德·斯珀林

(所有的帖子)
Ed Sperling是《半导体工程》杂志的主编。

限制人工智能系统的能力

埃德·斯珀林

留下回复取消回复

知识中心博客

低功耗设计

机器学习(ML)

人工智能(AI)

PPA(功率、性能、面积)

技术论文

热门文章

所有的半导体投资都去了哪里

后方电力输送的挑战

UCIe真的是通用的吗?

周回顾:半导体制造，测试

启动资金:2022年11月

知识中心
探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

定制的硅响尾蛇芯片设计生态系统

结构、晶体管、材料的巨大变化

所有的半导体投资都去了哪里

芯片架构的基本变化

EDA的下一个化身

扇出包装越来越有竞争力

赞助商

最近的评论

关于

导航

与我们联系

限制人工智能系统的能力

埃德·斯珀林

留下回复取消回复

知识中心博客

低功耗设计

机器学习(ML)

人工智能(AI)

PPA(功率、性能、面积)

技术论文

热门文章

所有的半导体投资都去了哪里

后方电力输送的挑战

UCIe真的是通用的吗?

周回顾:半导体制造，测试

启动资金:2022年11月

知识中心探索实体、人员和技术

相关文章

芯片设计随着基本定律的失效而转变

新一代晶体管有什么不同

定制的硅响尾蛇芯片设计生态系统

结构、晶体管、材料的巨大变化

所有的半导体投资都去了哪里

芯片架构的基本变化

EDA的下一个化身

扇出包装越来越有竞争力

赞助商

通讯注册

受欢迎的标签

最近的评论

关于

导航

与我们联系

知识中心
探索实体、人员和技术