当我出错

到目前为止没有工具,没有明确的方法来消除错误。这需要理解一个AI错误实际上是什么。

受欢迎程度

的竞赛已经开始,以求开发智能系统可以开车,诊断和治疗复杂的医疗条件,甚至火车其他机器。

问题是,没有人确切知道如何诊断潜在的或不那么显而易见的缺陷 系统或更好的是,以防止发生在第一个地方。虽然机器可以做一些事情很好,它仍然是人类设计程序来训练他们,观察他们,这系统远非完美。

“我们还没有一个好的答案,”杰夫说六须鲇,副总裁兼实验室主任IBM阿尔马登研究。

他不是一个人。而人工智能、深度学习和机器学习正在采用跨多个行业,包括半导体设计和制造,重点是如何使用这项技术,而不是当事情出错。

“调试是一个开放的研究领域,”诺曼Chang说,首席技术专家有限元分析软件。“这个问题还没有得到解决。”

至少部分问题是,没有人是完全确定会发生什么一旦训练设备,特别是深入学习人工智能和各种类型的神经网络。

“调试基于理解,”史蒂文说哇,企业解决方案技术和杰出的发明家的副总裁Rambus。“有很多了解大脑如何用磨刀石磨,所以它仍然是一个挑战古典意义上的调试,因为您需要了解当错误发生。我们需要更多的一种“我不知道”的分类。”

这是很长的路从科幻小说中描述的一些场景,在机器接管世界。错误的算法可能会导致意想不到的,这样的一个错误。如果涉及功能安全系统,它可能会造成伤害,但在其他情况下,它可能产生恼人的行为在一个机器。但有什么不同的人工智能(AI),深度学习(DL)和机器学习(ML)是修复这些错误不能被实现通过应用软件补丁。此外,这些错误可能不会出现几个月或年直到有一系列的交互与其他设备。

“如果你训练一个网络,吸引力在于,你可以让它更快和更准确的,”戈登·库珀说,产品营销经理Synopsys对此的嵌入式视觉处理器家族。“一旦你训练一个网络出现问题,只有一定可以追溯到一行代码。现在调试变得一个棘手的问题,这是一个不能一定提前避免。”

足够好是什么?
半导体世界是一个潜在的主题,“足够好是什么?“答案变化很大从一个细分市场,并从一个应用程序到另一个地方。它甚至可能从一个函数变化到另一个相同的设备。例如,在智能手机上的游戏一个错误可能令人讨厌,可能需要重新启动,但是如果你不能打个电话你可能会挂上电话。工业设备,技术可能直接与收入挂钩的,所以它可能甚至维护更换计划的一部分,而不是等待失败。

深度学习和机器学习,人工智能,不存在这样的指标。推论结果数学分布,不是固定的数字或行为。

“最大的问题是如何对或错,如何与人类相比,”Mike Gianfagna说,负责营销的副总裁eSilicon。“如果是比一个人,好吗?这可能是我们永远不会最终证明。这些都是训练数据的函数,一般训练数据越多,你越接近完美。这是很多不同于过去,你只关心算法和接线是否正确。”

这是一个地方的问题可以潜入。虽然有大量的数据卷制造、设计方面要少得多。

“对我们来说,每一个芯片是如此独特,我们只处理一个几百系统,输入数据的体积很小,”泰Garibay说,首席技术官ArterisIP。“这东西是一个黑盒。你怎么处理你以前从未处理的东西,特别是涉及偏见和伦理的问题。你需要更多的训练数据。”

连什么是一个错误的认知是不同的AI / DL /毫升。

“错误的定义改变因为算法的能力发展,和算法统计而不是确定的,”渡边Yosinori高级建筑师节奏系统&验证组。“有时候,一个可能无法隔离一个特定的输出你获得一个算法的这种错误,因为它是基于改进的概率分布中捕获算法。”

这可以避免通过设置一个清晰的边界条件可接受的行为的算法,渡边说。然而,理解这些边界条件并不总是那么简单,部分原因是算法本身在不断细化,部分原因是这些算法被用于各种各样的应用程序。

了解未知的
的起点之一调试AI / ML / DL是描述你所做的事和不理解。

这是简单的在机器学习比在深度学习,两者都适合在AI的伞下,由于算法本身是简单。深入学习是基于多层数据表示的矩阵,上一层,每一层都使用的输出作为输入。机器学习,相比之下,使用算法开发为一个特定的任务。

“深度学习,更难以理解的决策过程,”迈克尔说Schuldenfrei,首席技术官的优+。“在生产环境中,你想了解哪里出了问题。你可以解释机器学习算法的模型来自和做很多不同的工作比较算法,但答案仍然可能是不同的在不同的产品。在产品,随机森林可能会工作得很好,而在产品B,另一个算法或一些组合效果更好。但是机器学习不好当没有大量的数据。另一个问题是当你有很多的独立变量发生变化。”

这就是今天的大部分研究集中。

“一个人工智能系统也可以看狗,确定这是一只小狗或某种类型的狗,”IBM的六须鲇说。“你需要知道的是什么特征选择。可能有五六特征,机器已经确定。正确的特征吗?在另一个或有过分强调一个特点?这一切回到人擅长与机器。”

事件链这一决定很好理解,但决策过程并非如此。

“这整个可辩解的人工智能,即你把一些数据到系统,,突然从里面蹦出来一个答案,”罗伯•艾特肯表示手臂的家伙。“这并不一定向你解释的精确推理链导致答案,但它说,“这里有一些属性的输入数据,强烈影响这个答案出来了这样的事实。即使能够这样做有利于各种环境,如果我们给人工智能程序或机器学习算法更多的控制决策,然后它帮助如果他们可以解释为什么。好吧,你没有得到你的汽车贷款,这是数据的特定标记。有一个反面的安全。有一些攻击的机器学习算法,通过询问算法给你反应在给定的数据集,通过玩这些数据可以推断出其训练集是什么。所以你可以学习一些据称机密事情训练集通过选择查询。”

训练数据偏差中发挥着关键作用,。

“这是一个巨大的挑战在医学数据,因为在某些地区有分歧专家如何标签的东西,所以你不得不在开发算法中忍受噪音的标签,”艾特肯说。“我们知道算法这是做什么,我们观察到它告诉我们的东西似乎是有用的。但同时我们也已经证明了自己,无论偏见进入输入设置流行的输出。是智力的一个例子是,只是推理滥用的一个例子,还是我们还不知道?”

什么可行,什么不
一旦确认了虫子,摆脱他们的实际过程不清楚,。

“解决这个问题的一个方法是来从一个传统的一面,如支持系统和优化内存带宽,”鲁珀特•贝恩斯说,公司的首席执行官UltraSoC。“但没有人知道这些系统如何工作。如何配置一个黑盒?你不知道要寻找什么。这可能是一个情况下你需要机器学习来调试机器学习。你需要训练主管训练这些系统并识别出什么是好的和坏的。”

训练数据的微小变化也可以传播。“数据用于训练一台机器可能由另一台机器,“节奏的渡边说。“后者机器可能实现不同算法,或者它可能是一个不同的实例,实现了相同的算法。例如,两台机器,实现一个算法来玩围棋,可能互相玩,所以每台机器生产数据使用的其他培训。上面调试的原理仍然是一样的,因为每台机器的行为进行验证可接受行为的边界条件分别。”

另一种方法是保持应用程序的AI / DL /毫升足够窄,它可以不断地完善内部。“我们开始TensorFlow算法和很快发现他们没有足够的,所以我们搬到随机森林,“Sundari Mitra说的首席执行官NetSpeed系统。“然后你会怎么做?今天我们所做的分析,我们能够改变我们的方法。但是你怎么做到的深度学习已经制作吗?

进展到目前为止
让事情更加混乱,所有这些系统都是基于训练算法几乎在一个不断变化的状态中。在实际应用程序中使用,出现问题。从训练数据修改,和推论系统进行了分析和测试,以了解这些变化影响的行为。

”,数据不仅包括testbench和刺激一代表现如何,但它也涉及设计表现如何,”马克说克拉产品营销经理导师,西门子业务。“它知道为了生成一组良好的测试我想做很多不同的事情,也知道如果我试图提供一个特定的刺激到设备和我做过1000次的天,在我的模拟农场,我总是得到相同的结果,它知道不这样做因为我要得到相同的结果,因此必须做些不同的事情。Iit实际上是一个应用程序的一些方法非常类似于我们称之为正式的技术,但它不是纯粹意义上的形式验证的方式我们考虑财产检查和assertion-based验证。这是正式的正式的数学。”

克拉指出,领先的公司已经在这工作了一段时间。“我们还没有看到任何商业,但你可以想象贝尔实验室的客户类型。有少数客户长期以来在一些科技发展的最前沿,不一定用于商业目的,”他说。

前进的道路
多年来,调试AI的炉子上,手写算法被大学和研究房屋开发和测试。在过去的一年里,所有这些已经改变了。机器学习、深入学习和人工智能无处不在,甚至所使用的技术是更广泛的系统中就在去年被测试。

必须改变,很快。其中的一些应用程序背后的理念是,人工智能可以用于培训其他系统和提高制造业的质量和可靠性,但这只训练数据本身是没有错误的。在这一点上,没有人确切知道。

——安Steffora Mutschler对此报道亦有贡献。



留下一个回复


(注意:这个名字会显示公开)

Baidu