中文 英语

填补机器学习中的漏洞

第2部分:确保机器按预期运行的短期和长期解决方案。

受欢迎程度

使用机器学习的公司数量正在增加,但到目前为止,还没有工具来验证、验证和调试这些系统。

这给越来越依赖机器学习来优化技术的芯片制造商和系统公司带来了一个问题,因为至少就目前而言,机器学习可能会产生极难追踪和修复的错误。与此同时,它为那些一直在开发静态工具的公司提供了新的机会,使其业务范围远远超出芯片领域,而芯片领域的利润正受到系统供应商的挤压。

但是正如第一部分在这个系列中,这将需要几年而不是几个月的时间来修复。关于如何解决这些问题的研究才刚刚开始,更不用说开发全面的工具套件了。

“总的来说,机器学习突然变得非常有趣,”公司首席执行官兼联合创始人Sundari Mitra说NetSpeed系统.“如果你从机器学习的角度来看整个EDA行业,它给我们带来的是合成。随着越来越多的人有机器学习的背景,有这方面的专业学位,他们会被吸引去解决这些问题。我看到了一场运动——当它变得足够痛苦时,有人会赞助它。他们会让一些人注意到这一点,并应用其中的一些技术来解决我们的一些模拟问题。”

那么,芯片制造商在此期间会做些什么呢?

短期解决方案
现在有几种方法可以最小化潜在的问题。一是严格限制机器学习的使用范围。

“你可以提出适应的机器学习算法,比如基于过去发生的事情优化功率,”市场营销副总裁迈克·吉安法尼亚(Mike Gianfagna)说eSilicon.“但这是对具体问题的激光关注。你必须限制范围,否则问题就大了。如果你确实有问题,要么是数据不好,要么是自适应学习不好,要么是你需要优化算法。但这里也有很多微妙之处,比如正确的流程。这不是机器学习,但它会影响机器学习。当你进入28nm及以下,物理规则并不总是适用。所以可能会有逆温。你的数据可靠吗?你必须确保机器学习算法能够正确适应。”

Gianfagna说,通过并发故障模拟,故障电路的数量会增加或减少。“实时跟踪所有这些电路就像管理一个膨胀和收缩的宇宙。这将把我们带向很多有趣的方向,我们将不得不做更多与人类大脑运作方式并行的事情。如果你看看人类的大脑,它不是那么快,但它是适应的。如果你看一下机器学习问题,从定义上讲,它们表现不好。”

第二种方法涉及更多的混合方法,即根据特定功能的编程来“教授”机器,这就是今天智能手机所做的。

Tirias Research首席分析师吉姆·麦格雷戈(Jim McGregor)表示:“机器可以在不使用认知学习或人工智能的情况下从错误行为中学习正确。”“如果需要更复杂的响应,您可以使用设备上可用的资源并利用云。大多数计算机仍在以非常基本的方式“学习”。更复杂的是自动驾驶汽车,你真的需要机器学习和人工智能来解释环境,利用环境,并永久地改变算法。在这种情况下,调试是一个完全不同的世界。改变的是你不再寻找问题。现在是关于指导和给予反馈。”

第三种方法是将功能的任何更改限制在软件中。虽然从电源/性能的角度来看,这不是最优的,但理论上它更容易调试。制造视觉处理单元的Movidius公司已经在使用这种方法。Movidius的首席技术官大卫·莫洛尼(David Moloney)说:“你依赖的是在云端训练的网络,它拥有足够的数据集。”“它不是一个连接到CNN(卷积神经网络)的大型引擎。它是在软件中完成的,所以如果有问题,那就是软件的问题。专用硬件存在风险。有了软件平台,你就不会被硬件的决策所束缚。”

Moloney说,机器学习的一个大问题是,每隔几天事情就会发生变化。“这包括工具算法和网络拓扑,”他说。“通过这种方式,你使用哪个平台都无关紧要。但网络越深,功耗越高。电网的电力回报不是线性的,所以我们面临的挑战是设计出节能的电网。”

长期的解决方案
硬件和软件的结合是优化系统的一种更有效的方式,但它也更难控制。机器学习基于大量数据,这反过来又需要数据挖掘等大数据方法。使用数据挖掘调试系统属于预测分析的范畴——用模式预测行为。

“你真正在做的是寻找行为中的异常值,”首席验证科学家哈里·福斯特(Harry Foster)说导师图形.如今,大约72%的设计都有一个或多个嵌入式处理器。你开始验证过程,结果往往不是你所期望的。所以你用机器学习技术进行数据挖掘,你发现了一个。在这种情况下,数据挖掘被用作验证工具。使用约束随机生成,您将看到操作的延迟。通过数据挖掘,您可以扫描大量的数据,并找出为什么一个操作要花费五倍的时间。机器人也是一样。你不可能教会机器人它要做的每一个方面。它必须进化。 But that requires whole new ways to validate systems. So while the algorithm is learning, an agent also needs to be learning. That allows you to work back and forth in validation.”

福斯特说,这将需要更多的统计分析来识别奇怪的行为。“使用我们现有的方法,您可能已经运行了数千次而从未发现问题。使用数据挖掘,您可以发现在其他任何地方都找不到的问题,然后调试根本原因。但从本质上讲,这将比我们今天所做的更具统计学意义。”

弹性和容错是另一种长期方法。这个概念在计算机世界已经存在了几十年。纠错码存储器(Error correcting code memory, ECC)可以检测和纠正内存位的错误。同样,大多数系统都是备份的,大多数大公司都有故障转移系统,以防出现问题。

“汽车行业越来越多地采用知识产权复制,”查理·贾纳克说,Arteris董事长兼首席执行长。“这是对抗软错误的一种方法。如果使用将图像处理器转换为数据包的重复ip,则可以获得功能参考信号。如果存在分歧,就会得到一个错误。它就像互连中的ECC。使用机器学习的系统是类似的。您需要足够的探测点来隔离问题。最终,我们将需要抗故障的soc。但我们也需要了解哪一类事情可能出错。我们还不知道所有的机器学习错误是什么。”

机器学习展望
事实上,考虑到错误出现的不确定性,机器学习的令人惊讶之处在于它已经在很多地方被使用。虽然机器学习中涉及的基本概念已经讨论了很多年,但它们的应用一直是理论性的,而不是实际的。例如,如果数据不可用或连接不可用,会发生什么?这对机器学习有什么影响,尤其是在物体识别方面?

“这是全新的,”Leti首席执行官玛丽·塞梅里亚说。“首先,我们必须考虑用途。我们需要什么?这是一种完全不同的驾驶技术。这是神经形态技术的推动。首先你要弄清楚自己需要什么,然后想出解决方案。”

sememeria表示,Leti正在开发由物联网应用驱动的芯片,研究机构通过演示功能并请求最终用户反馈,以确保开发工作满足他们的需求。“这更像是一种系统方法,能够与我们的客户讨论全球解决方案。所以我们完全改变了我们推动研究的方式。这就是我们最近参加CES的原因。”

这也有助于英特尔收购阿尔特拉成角度。英特尔一直在推动机器学习作为优化数据中心运营的一种方式,但由于FPGA的可编程结构,使用FPGA比使用ASIC更容易进行这种持续的优化。

"我们看到人们对硬件在环固件测试的兴趣越来越浓厚,"微软产品营销副总裁Kevin Ilcisin表示国家仪器.“我们的想法是,你可以改变FPGA中的硬件结构,但你需要能够抽象测量。”

其中一些工具已经存在,所以不是所有这些都需要从头开始开发。但这些工具最终将如何被参与机器学习的公司使用,以及还需要什么来提高它们的效率,目前还不清楚。对于汽车行业来说尤其如此,在汽车行业,驾驶员辅助将是机器学习场景的集合。

英特尔高性能ASIC原型系统技术营销经理Achim Nohl表示:“现实世界的测试越来越成为一种要求,你要考虑硬件和软件。Synopsys对此.“我们将看到越来越多的卷积神经网络加速器,我们将不得不在现实世界中从设计验证扩展到系统验证。您需要对系统的正确反应有最高的信心。是否需要对场景进行标准化?是否有必要标准化参考数据集,这样汽车就可以对它们做出反应,而不是担心特定系统的性能?如今,我们对测试数据进行了标准化,但在现实场景中却没有。”

诺尔指出,这也需要测试数据的生成和共享速度足够快,才能发挥作用。“这不仅仅是软件或硬件的问题。我们几乎在每个领域都需要长时间的调试跟踪。”

结论
因为机器学习才刚刚起步,所以缺乏关于开发有效工具需要什么、什么时候准备好、成本多少等方面的硬数据。在这一点上,没有人确切地知道这些工具会是什么样子。

“一旦你有了数据,更大的问题是你要用它做什么,”公司总裁兼首席执行官雷克·布林克曼(Raik Brinkmann)说OneSpin解决方案.“这是一个没有测试平台的系统,也没有任何方法来概括和验证它。由于机器学习,芯片的制造方式正在发生变化。你基本上会在车里有一台大电脑,如果数据有延迟,它就无法工作。所以你有传感器融合,你把所有东西都尽可能地推向中心,你创造的soc可以在尽可能靠近传感器的地方进行机器学习。”

这种方法的破坏性究竟有多大,还有待观察。“正确的本质是不同的,”克里斯·罗文(Chris Rowen)说节奏该公司知识产权集团的研究员和首席技术官。“你必须采用统计方法来管理这种正确性。有分析认为,这是改变低层核查性质的契机。一些人提出了更高并行架构的新方法。但我们知道的一件事是,深度学习和机器学习有助于在设计中开辟新的自由度。”

有关的故事
机器学习第1部分缺少什么
教机器如何行为是一回事。在那之后理解可能存在的缺陷是另一回事。
人工智能和深度学习内部
人工智能正在发生什么?今天的硬件能跟上吗?
认知计算对芯片设计的意义
独立思考的计算机将被设计得与一般的SoC不同;对生态系统的影响将是巨大的。
新架构,加速芯片的方法
10nm和7nm的性能指标正在发生变化。速度仍然很重要,但一种方式并不适合所有人。
一对一:约翰·李
将大数据技术和机器学习应用于EDA和系统级设计



留言回复


(注:此名称将公开显示)

Baidu