第九章神经网络

时间：2023-01-05 11:14:35浏览次数：41

标签：第九章梯度 sum 传播神经网络 theta grad

(1) 案例：使用神经网络实现逻辑运算
(2) 多元分类
(3) 代价函数
(4) 前向传播
(5) 反向传播
(6) 随机初始化
(7) 梯度检测

大多数的机器学习所涉及到的特征非常多，对于非线性分类问题，往往需要构造多项式来表示数据之间的关系，多项式的组成方式千变万化，这对计算带来一定困扰。

机器学习中的神经网络一般包括三部分，输入层，隐藏层，输出层。

数据从输入层开始，通过激活函数前向传播到第一隐藏层，经过多个隐藏层，最后到达输出层，神经网络表示复杂的逻辑关系，主要是对隐藏层的构造。

(1) 案例：使用神经网络实现逻辑运算

AND运算

OR运算

NOT运算

XNOR运算

\[\begin{align*} XNOR&=(x_1\ \&\ x_2)\ OR\ (\bar{x_1}\ \&\ \bar{x_2})\\ &=NOT(x_1 \ XOR \ x_2)\\ \end{align*} \]

(2) 多元分类

通过构建神经网络，每种输出就对应一个分类器。

(3) 代价函数

\(K\) 表示输出层的单元数目，\(L\) 为神经网络的层数。

代价函数：

\[J(\Theta) = -\frac{1}{m} \sum_{i=1}^m \sum_{k=1}^K \ [ \ y_k^{(i)} log^{(h_{\Theta}(x^{(i)}))_k} + (1-y_k^{(i)} log^{(1 - (h_{\Theta}(x^{(i)}))_k)} \ ] + \frac{\lambda}{2m} \sum_{l=1}^{L-1} \sum_{i=1}^{s_l} \sum_{j=1}^{s_l + 1} (\Theta_{ji}^{(l)})^2 \]

(4) 前向传播

(5) 反向传播

(6) 随机初始化

在对神经网络进行训练时，\(\theta\) 的取值要随机取值，如果都赋值为 0，就会使得每一层的输出值、误差相同，从而存在大量冗余。

(7) 梯度检测

为了确保反向传播算法的正确性，在数学上使用拉格朗日中值定理来近似的表是曲线上某一点的导数，梯度检测正式使用的这种思想。

梯度检测可以对每个参数进行单独验证。

\[\begin{align*} \theta^{i+} = \theta + \begin{bmatrix} 0\\ 0\\ \vdots\\ \delta\\ \vdots\\ 0\\ \end{bmatrix} \ \ \ \ \ \ \theta^{i-} = \theta - \begin{bmatrix} 0\\ 0\\ \vdots\\ \delta\\ \vdots\\ 0\\ \end{bmatrix} \\ f_i^{(\theta)} \approx \frac{J(\theta^{i+}) - J(\theta^{(i-)})}{2 \delta} \end{align*} \]

假设通过中指定理的得到的梯度为 \(approx_grad\)，经过反向传播得到的梯度为 \(grad\)，如果满足以下等式，则说明反向传播得到的梯度精度还行。

\[diff = \frac{||approx_grad - grad||}{||approx_grad + grad||} < 10e^{-9} \]

梯度计算正确的情况下，当算法进行学习的时候要关闭梯度检测，因为它非常耗时。

标签：第九章,梯度,sum,传播,神经网络,theta,grad
From： https://www.cnblogs.com/lumoumou/p/17024112.html

卷积神经网络在直播美颜SDK中有哪些作用？
在之前的技术话题中，小编曾经聊到了直播美颜SDK技术深度学习和机器学习方面的问题。实际上，在宏观角度来讲，深度学习只是一个框架，其中有各种各样不同的美颜算法而已，其中最重要......
《安富莱嵌入式周报》第291期：分分钟设计数字芯片，单片机版JS，神经网络DSP，microPLC，FatFS
视频版：https://www.bilibili.com/video/BV1Dd4y1b74x1、英飞凌推出双核M7+M0芯片XMC7000，8MBFlash，1MBRAM，2.7-5.5宽电压，10个CANFD，20通道LIN-UART，96通道12bitA......
【LSTM时序预测】基于卷积神经网络结合长短时记忆CNN-LSTM实现时序数据预测附matlab代
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
分类预测 | MATLAB实现BiLSTM双向长短期记忆神经网络多特征分类预测
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
part2_01神经网络的准备
神经网络的概念由连接主义学派提出。每一个神经网络都由若干个互有交互、连接的感知器，或称为神经元，以网络连接层的形式构成，感知器与感知器之间在满足特定的条件下会互相传......
torchviz进行pytorch神经网络可视化
一、安装需要系统安装Graphviz工具，如果是自己电脑上可以用yum、apt等工具安装，但是如果在服务器上，没有root权限的那种就会比较困难。需要root权限，如果是虚拟的容器可以在do......
【开源代码】首个利用神经网络能够明确推断VIO中 IMU bias演化的方法
以下内容来自从零开始机器人SLAM知识星球每日更新内容点击领取学习资料→机器人SLAM学习资料大礼包论文##开源代码#DeepIMUBiasInferenceforRobustVisual-Iner......
干货 | 神经网络与深度学习精选文章汇总
AI有道不可错过的AI技术公众号下面这部分列出了吴恩达深度学习专项课程中关于NN和DNN方面的所有精炼笔记。主要包括：神经网络与深度学习、优化神经网络、构建机......
NC16679 [NOIP2003]神经网络
题目链接题目题目描述人工神经网络（ArtificialNeuralNetwork）是一种新兴的具有自我学习能力的计算系统，在模式识别、函数逼近及贷款风险评估等诸多领域有广泛的应用。对......
神经网络模型详讲（14）
一、简介主要介绍了LeNet、AlexNet、VGGNet、ResNet、NetWorkInNetwork、GoogleNet；二、LeNet详解 LeNet-5是一个较简单的卷积神经网络。下图显示了......

第九章神经网络

(1) 案例：使用神经网络实现逻辑运算

(2) 多元分类

(3) 代价函数

(4) 前向传播

(5) 反向传播

(6) 随机初始化

(7) 梯度检测

相关文章

赞助商

阅读排行

第九章 神经网络

(1) 案例：使用神经网络实现逻辑运算

(2) 多元分类

(3) 代价函数

(4) 前向传播

(5) 反向传播

(6) 随机初始化

(7) 梯度检测

相关文章

赞助商

阅读排行

第九章神经网络