中文 英语
知识中心
导航
知识中心

深度学习(DL)

深度学习是人工智能的一个子集,其中数据表示基于矩阵的多层。
受欢迎程度

描述

深度学习的定义仍然有点模糊。它位于人工智能的保护伞下,或与机器学习并列,或作为一个子集。不同之处在于机器学习使用为特定任务开发的算法。深度学习更多的是一种基于矩阵多层的数据表示,其中每一层都使用前一层的输出作为输入。这种方法更接近于模拟人类大脑的活动,人类大脑不仅可以判断棒球正在运动,还可以大致判断它将落在哪里。

然而,在这一切的背后,对于深度学习究竟是如何工作的,尤其是在它从训练转向推理的过程中,人们并没有达成共识。深度学习更多的是复杂行为的数学分布。为了实现这种表示,并对其进行塑造,需要使用许多体系结构。深度神经网络和卷积神经网络是最常见的。循环神经网络也在使用,这增加了时间的维度。rnn的缺点是大量的处理、内存和存储需求,这限制了它在大型数据中心的使用。

英国计算机科学家和认知心理学家杰弗里·辛顿(Geoffrey Hinton)也一直在推动胶囊网络的想法,这种网络将神经网络的层层层叠加,基本上增加了这些层的密度。根据Hinton的说法,结果要好得多,因为它可以识别高度重叠的数字。这是贯穿当今许多研究的主题之一——如何加快整个过程。

这个问题太复杂了,远远超出了人类大脑解决一切问题的能力,所以所有这些都必须建模或理论化。对于芯片制造商来说,这并不是什么新鲜事。自从芯片达到了1微米的工艺节点,就很难在设计中可视化所有不同的部分。但在计算机科学领域,许多进步基本上都是二维的。旋转或倾斜的对象在数学上更难表示,这需要大量的计算资源。为了提高速度和效率,研究人员正试图找出减少这些计算的方法。尽管如此,这仍然是一个巨大的挑战,而且对于深度学习专家来说,这在很大程度上是不透明的。

与人工智能和机器学习一样,深度学习在研究领域已经存在了几十年。改变的是,从数据中心到简单的微控制器,它被添加到许多类型的芯片中。随着算法在训练和推理方面变得越来越高效,机器学习/人工智能连续体的这一部分开始在广泛的使用模型中出现,一些用于非常狭窄的应用,一些用于更广泛的上下文决策。

多媒体

多媒体

多媒体

Baidu