五个问题:杰夫棺材

嵌入式视觉联盟的创始人兼总裁BDTI谈到的创建联盟和神经网络的出现。

受欢迎程度

创始人兼总裁杰夫棺材BDTI,坐下来与半导体工程讨论嵌入式视觉联盟的创建和神经网络技术的扩散到嵌入式系统。

嵌入式视觉联盟形成SE:为什么?

棺材:大约5年前,计算机视觉是即将成为一个改变世界的技术。成为可能,首次实现计算机视觉系统中高度受到成本、规模和功耗。有很多强大的功能,可以通过计算机视觉,是用户界面或安全,安全或质量。我们知道这很长一段时间,但大部分时间,这是不实际的实现在日常产品。它太昂贵的计算。但行业跨越一个阈值,它把复杂的计算机视觉成为现实到几乎任何事情。我们看到今天在消费品领域与范围广泛的应用程序,这是在合适的价格点和电池供电的产品。

SE:你希望获得吗?

棺材:这种过渡的特点是产品开发人员,谁将能够利用视觉技术,没有意识到这一点。他们还认为这是昂贵,可望而不可即。10000年产品开发人员需要知道它是在达到第二的开发人员需要了解的技术是如何工作的,并不是能力,重要的权衡,供应商,已知技术等都是有效的。

BDTI开始一个行业协会,成为了嵌入式视觉联盟,以解决那些视觉上的挑战,这能让产品开发人员意识到是一种技术,可以被纳入任何产品和提供实用的知识和技能,他们需要认识到他们的想法。同时,我们提供了一个自然的机会对于联盟的成员公司,是谁使供应商技术和服务,比如处理器和传感器、算法和开发工具,使自己可见产品开发商。

SE:重要的是神经网络的未来嵌入式视觉?

棺材:神经网络(NN)技术是新兴的非常快。迄今为止绝大多数的部署视觉系统不使用神经网络,但也可以说,大部分的视觉系统开发人员如今至少考虑使用它们。

SE:计算机视觉的最大挑战是什么?

棺材:计算机视觉与无线通讯对比。在无线通讯,我们理解物理信号是如何在空间传播和反射的表面。这意味着我们有良好的无线电通信的数学模型。结果,如果你向一屋子的通信设计人员提供一个问题,他们会倾向于聚集在相同的解决方案解决方案或少量使用频段,调制方案,什么样的天线,传输能量。数学引导他们朝着一个共同的解决方案。

随着计算机视觉,我们正试图模仿人类的视觉感知和我们真的没有一个好的数学框架来理解人类的感知是如何工作的。人类从视觉输入提取的意义如何?因此,没有算法会导致人们收敛,事实上相反的更有可能。有一个令人难以置信的各种算法,因为他们没有一个框架,引导他们走向共同类型的解决方案。他们也非常困难的问题。很难弄清楚如何从视觉输入提取所需的意义。有各种各样的问题,如对象的一部分是由另一个对象,该对象是背光,可怜的照明,眩光,对象是一个奇怪的方向,可变形物体等一个人,可以出现在一个无限的各种姿势。当你所有这些因素结合在一起,它是非常困难的。

SE:神经网络解决方案是如何不同于早期的嵌入式视觉解决方案?

棺材:汽车以每小时30英里的速度在街上看到许多对象在它的视野。你想知道,绝对确定性,如果有行人在车子的地方将会在接下来的30秒。东西可能尝试在实验室中使用有限的测试数据。它工作在实验室里,然后它是纳入的试验和不可避免的失败。开发人员将捕获的图像时失败,回到实验室和诊断他们失败的原因,然后调整算法。当他们这样做时,算法几乎总是越来越复杂。他们会发现他们的方法没有在光线暗的条件下工作,所以他们将在模式选择器,该选择器将确定照明条件和使用不同的算法。所以你风非常简单和复杂的算法,不断调整和完善,因为你有无限多种输入。与此同时,你要非常可靠的输出。

神经网络方法的承诺而不是改变算法,创建或选择算法本质上使机器学习和改善随着时间的推移,通过大量的例子所示。你不改善算法,虽然有潜力,。你改善其教学通过展示图片,正面和负面的例子。这是一个场景,有或没有一个行人。该算法有一个内置的学习能力。它变成了一个两阶段的事情,你有学习或训练阶段,消耗大量的计算能力,但通常是一个离线过程,然后是部署阶段训练算法执行。它可以随着时间的推移,与更多的例子是重新训练,提高其准确性。为什么人们如此兴奋神经网络的原因是,他们提供一个有吸引力的方式来解决不断调整为特点的视觉应用程序与一个更统一的框架和算法。调整,我们训练算法。



留下一个回复


(注意:这个名字会显示公开)

Baidu