-
DL与其他模型:深度学习模型是统计学中的“半参数推断模型”的子集。它们通过堆叠多个处理隐藏层来推广人工神经网络,每个层都由许多神经元组成。
-
“深度”之意:“深度”这个词与知识通过连续的表示层被获取的方式有关。
-
工作原理:
- DL方法基于多层(“深度”)的人工神经网络。
- 不同的节点(“神经元”)从下一层接收输入,并根据一组激活规则被激活。
- 激活再次定义了发送到下一层的输出,下一层将此信息作为输入接收。
- 每一层中的神经元接收上一层神经元的输出作为输入。
-
权重的重要性:连接的强度称为权重,反映了它的重要性。如果连接的权重为零,一个神经元对下一层的相应神经元没有任何影响。如果权重是正的,影响是兴奋的;如果权重是负的,影响是抑制的。
-
DNN的视图:深度神经网络可以被看作是有向图,其中的节点对应于神经元,而边对应于它们之间的链接。
-
示意图的解释:文献中的图1展示了一个非常受欢迎的深度神经网络,称为前馈神经网络或多层感知器(MLP)。这个网络包含8个输入,一个输出层和四个隐藏层。输入传递给第一个隐藏层中的神经元,然后每个隐藏神经元产生一个输出,这个输出被用作第二隐藏层中每个神经元的输入,以此类推。最后,四个隐藏层中的每个神经元的输出被用作获取三个感兴趣特征的预测值的输入。
-
激活函数的重要性:在每个隐藏层中,我们都得到了输入和权重(包括截距)的加权和,这被称为净输入,然后应用了一个称为激活函数的转换来产生每个隐藏神经元的输出。