嵌入式视觉变得无处不在

神经网络有推动嵌入式视觉,它们可以被纳入低成本和低功耗设备。

受欢迎程度

嵌入式的愿景是成为一个激烈的话题由于神经网络的出现,使计算机系统的能力学习的例子。

神经网络是一个非常不同的处理元素相对于其他类型的处理器的IP阿森纳今天在他们不是相同的方式编程。他们没有指令流定义应使用哪些数据、如何操作。相反,神经网络训练使用一组示例模式然后他们提供最好的答案模式在操作,没有过去。换句话说,他们学习的方式类似于人类的大脑和想出一个最好的猜测。

计算机视觉已经在超级计算机表现和优化了几十年,但它是一个非常困难的问题。你怎么能通过算法定义一只猫的样子和你如何区别于一只狗吗?简单不过,如何执行高度可靠的手写识别?随着时间的算法改进,然后研究人员开始对神经网络和机器学习作为替代方法问题。

神经网络试图复制的某些方面的大脑的工作方式。一个神经元数量的输入,每个输入都有一定的重量。非线性函数执行神经元内产生一个输出,反过来助长其他神经元。

“基本方面的计算是非常普通,同样令人沮丧,”说,首席技术官超音速。“理想的假设的结构是每个神经元连接到其他神经元,这样每个神经元可以通过耦合影响其他。这可能是一个巨大的矩阵乘法,但事实上大部分事情都不是真正的连接,所以你真的需要一个稀疏矩阵。这是令人沮丧的方面来的地方。”

优化网络的目标应用程序识别利率就会带来明显的好处,特别是在训练和推理的计算复杂度。“神经网络,特别是卷积神经网络由1 d, 2 d和3 d的过滤操作密切相似的操作用于实现dsp、过滤”解释说,研究员节奏

两步的过程
与传统的编程,网络训练和执行。“卷积神经网络已成为一种主要的模式识别器,因为他们允许一个简单的系统(但计算量)的方法训练,“再生草说。“培训需要极其沉重DSP-like计算与最速下降优化(误差反向传播)。识别函数本身(“推理”)仍然是计算要求,一些应用程序需要数万tera-ops每帧图像,例如,但许多神经网络应用程序当前高端需求方的能力之内,和新CNN-optimized需求方。此外,网络可以训练一次,用数十亿美元或数万亿时代,这样培训的高费用平摊在许多使用。”

作为一个例子,离线训练可能会利用GPU的农场看看100000图片的面孔,然后创建一个CNN图设定的对象检测引擎。这两个阶段是紧密耦合的。“当培训完成,创建了图上运行一个特定的引擎,”迈克•汤普森表示,嵌入式视觉高级产品营销经理Synopsys对此。“有对象的特征检测引擎,你想利用。你想训练平台上运行。我们可以改进所需的内存和处理元素的数量需要回顾图并对如何优化做出选择。”

“最好的简单预测神经网络性能multiply-accumulate率,“再生草说。“传统cpu因此有能力做神经网络计算,但其multiply-accumulates每瓦每平方毫米,相当低。目前的高端需求方10 - 100 x比cpu在这个指标,更加有效和专业ultra-parallel需求方更好。”

市场
CNN已经存在了相当长一段时间,但最近的改进算法可以实现更高的精度。“今天,F1分数低的90年代和90年代精度高,”汤普森说。F1是一个face-based生物认证系统,考虑精度和召回来计算得分1最佳值,0为最坏的情况。“市场增长起到了推波助澜的作用,提高性能,降低成本和功耗的处理器,以及日益增长的意识的价值可以通过对象检测、跟踪、识别和其他视觉处理功能。”

brianvisionpic
来源:Synopsys对此嵌入式视觉系统市场预测到2020年超过300美元,复合年增长率为35%。

在视野内的汽车可能想到的第一个应用程序,汽车可能不是今天最大的人脸识别用户。“有些惊人的关于时间的分数的统计数据的主要照片共享网站花在训练神经网络让他们认识人,Wingard说。“很多这些天投资资金来自Facebook照片图像识别。人认为值得投资。人都是我操作的印象,他们可以包含在图像的数据。长期会想找一个赚钱的办法。”

苹果进入行动,与应用程序会认出你取照片。然后,他们更容易与你的朋友分享。一个新的专利(20150227782)几天前发表相关。

在工作中学习
因为培训过程的复杂性,这一步通常是执行离线和已部署的系统不会有能力学习。不过,这并不意味着训练停止。“网络需要改进或更新,因为新算法可用,或输入的变化,“Wingard说。“训练的本质就是你没有得到全局最优。你永远不会有“正确”的程序。这是一个问题你有“足够好”程序,使您能够识别你正在寻找什么。”

有趣的是,这就产生了两种截然不同的问题和机遇。“既然培训通常比识别更复杂(推理),大规模部署的网络重新训练次数少,“再生草说。“然而,加速训练是一个热门领域(一些先进的公司正在构建“培训超级计算机”),所以频繁的再培训是完全可行的。此外,我们预计系统将携带很多的训练集,并将自适应地选择训练集基于动态条件。神经网络训练还有助于部分培训,可以远远超过完整的培训和服务当识别任务是逐步发展的。”

虽然他们可能无法重新训练自己,这并不意味着他们不能改善随着时间的推移。“对象检测引擎是可编程的,有专门的硬件实现,所以我们得到效率高,”汤普森说。“我们也有RISC cpu相连。这是一个完全可编程环境和提供了一个巨大的计算能力,有助于TLD(跟踪、学习和检测)。我们可以像OpenTLD RISC处理器上运行。“OpenTLD跟踪的算法和开源实现未知对象不受约束的视频流,不利用训练数据。

验证的挑战
我们都知道,人类犯错误和失败的认识某人,或叫错别人的名字,但是,在计算机视觉的影响呢?“确实,神经网络本质上是启发式的,没有绝对的正确性,“再生草说。“毕竟,人类也不给绝对的答案。他们做出明智的估计和猜测。所以训练集的质量是衡量质量的结果当训练网络测试与一个独立的测试集。不仅需要大量训练集,而且不同的方式反映了实际输入的多样性。”

但至少可重复的结果。“神经网络不使用模糊逻辑,这是一个精确的算法正在运行,”指出Wingard。“你可以争论的精度需要的结果。这是没有考虑不同精度的算法和结果。给出的结果是可预测的输入。这确实使验证更容易,但是成功不是精确的定义。所以验证需要多少钱?你确认他们数学正确吗?有些人会认为这是足够的。算法需要改变。 There is no system level definition against which to validate.”

这似乎创建问题整合到一个汽车防撞系统。“重要的是要认识到,很难让这些系统100%可靠的,”说,总统的嵌入式视觉联盟。“获得信心最重要的方法是广泛测试它们。这是一个有意义的挑战,但它是可以克服的。奔驰已经航运高端汽车自动紧急制动系统好几年了。考虑品牌价值。品牌的价值是多少?会发生什么,如果他们刹车在高速中错误的原因和引发事故?这将是一场灾难。奔驰不是不计后果的。它被计算。 They have come to the conclusion that the technology is sufficiently reliable to be deployed with excellent results.”

可靠性也可以增加了使用多种类型的传感器。视觉系统在汽车安全应用程序可能使用相机结合雷达。雷达技巧不太容易被愚弄的光,在确定如果有更可靠的固体在你的路径和多远从传感器。然而,这并不有助于识别对象是什么。这两个在一起可以更可靠。

会有一个“手臂”神经引擎?
有许多公司发展知识产权今天神经网络实现的。会有竞争对手的层次结构与CPU核心,有吗手臂远远的领导者吗?说:“太早说棺材。“这是完全不同于人们做事的方式。很可能增加价值在每一层,在硅通过合适的处理器体系结构,可以有效地完成工作,或在堆栈的顶部通过收集和标记的数据训练能够有效地进行训练,这样需要一天,而不是一个星期做一个培训周期和各层中间。我们只看到现在的非常早期的阶段,但有很多机会和企业开始加大。这是一个完全不同的技术,它的优点开始形成自己的生态系统和。”

“我们期望看到网络结构复杂性和专业化成长,为优化网络结构出现更好的工具和方法发现,“再生草说。“我不认为这必然是由几个供应商,但神经网络发展的环境(网络优化、网络培训和映射到目标平台)可能成为一个重要的设计领域。”

结论
一个工程师需要知道什么?“对大多数系统,神经网络是一个函数,”Wingard说。“可能是独立的一段时间,但这是注定要集成,这将是一个巨大的黑盒SoC。没有其他的消失。只是一个新的子系统,有一些港口和某些类型的访问需求。只有一小部分人在一个团队必须了解这事。”

神经网络的时间终于来了吗?是的,Wingard说。“很多疯狂的技术思想只是死亡,但这是一个多年来一直搁置着一些高度可见的尝试在学术界和研究实验室,这个确实是这么做了。看来,它会变得非常有价值。”



留下一个回复


(注意:这个名字会显示公开)

Baidu