反向传播算法

反向传播算法

时间：2022-11-30 00:22:49浏览次数：53

标签：pre loss val init 传播算法反向 np new

0 梯度更新函式

1 梯度

神经网络参数如下：

θ = {w1, w2, ... , b1, b2, ...}

权重梯度如下：

为了更好且有效的计算梯度，我们使用反向传播算法。

2 链式法则

3 反向传播

损失函数(Loss function)是定义在单个训练样本上的，比如我们想要分类，就是预测的类别和实际类别的区别，通常用L表示。

代价函数(Cost function)是定义在整个训练集上面的，也就是损失函数的总和的平均。

总体损失函数(Total loss function)是定义在整个训练集上面的，也就是所有样本的误差的总和。也就是平时我们反向传播需要最小化的值。

对于L(θ)就是所有ln的损失之和，所以如果要算每个L(θ)的偏微分，我们只要算每个l^n的偏微分，再把所有l^n偏微分的结果加起来就是L(θ)的偏微分。

4 实例

计算梯度分为两个步骤：

计算∂w/∂z（Forward pass的部分）
计算∂z/∂l （ Backward pass的部分）

5 Forward pass

6 Backward pass

7 总结

我们的目标是要求计算Forward pass的部分和计算Backward pass的部分，然后把∂z/∂w和∂l/∂z相乘，我们就可以得到∂l/∂w,所有我们就可以得到神经网络中所有的参数，然后用梯度下降就可以不断更新，得到损失最小的函数。

8 简单代码实现

 1 # -*- coding: utf-8 -*-
 2 # @Time    : 2022/11/28 16:16
 3 
 4 import numpy as np
 5 
 6 # 输入数据
 7 x = np.array([[1, 1], [-1, 1], [-1, -0.5], [-1, 1.5]])
 8 t = np.array([0, 1, 0, 1])
 9 # print(x.shape[0])
10 w_init = np.array([1, 1])
11 b_init = 0
12 lr = 0.9
13 epoch = 0
14 
15 
16 # 前向传播
17 def forward(x, w, b):
18     val = np.matmul(x, w.T) + b
19     y_pre = np.zeros_like(val)
20     for i in range(x.shape[0]):
21         if val[i] > 0:
22             y_pre[i] = 1
23         else:
24             y_pre[i] = 0
25     return y_pre, val
26 
27 
28 # 计算loss损失
29 def loss_fuc(y_pre, w, b):
30     val = np.matmul(x, w.T) + b
31     loss = -(np.matmul(t - y_pre, val) / 4)
32     return loss
33 
34 
35 # parameter update
36 def grad_update(y_pre, w_old, b_old, lr):
37     grad_w = -(np.matmul(t-y_pre, x)) / 4.0
38     one = np.ones_like(t-y_pre).T
39     grad_b = -(np.matmul(t-y_pre, one) / 4.0)
40     w_new = w_old - lr * grad_w
41     b_new = b_old - lr * grad_b
42 
43     return w_new, b_new
44 
45 
46 if __name__ == '__main__':
47 
48     # 前向传播
49     y_pre, val = forward(x, w_init, b_init)
50 
51     # 计算loss
52     loss_result = loss_fuc(y_pre, w_init, b_init)
53 
54     # 打印输出结果
55     print("epoch:", epoch, "\n", "val:", val, "\n", "w_new:", w_init, "\n", "b_new:", b_init, "\n", "y_pre:", y_pre, "\n", "loss:", loss_result)
56 
57     # 反向传播
58     while loss_result != 0:
59         # epoch递增
60         epoch += 1
61 
62         # w，b参数更新
63         w_init, b_init = grad_update(y_pre, w_init, b_init, lr)
64 
65         # 前向传播
66         y_pre, val = forward(x, w_init, b_init)
67 
68         # 计算loss
69         loss_result = loss_fuc(y_pre, w_init, b_init)
70 
71         # 打印输出结果
72         print("epoch:", epoch, "\n", "val:", val, "\n", "w_new:", w_init, "\n", "b_new:", b_init, "\n",  "y_pre:", y_pre, "\n", "loss:", loss_result)

代码结果：

标签：pre,loss,val,init,传播,算法,反向,np,new
From： https://www.cnblogs.com/tqqnb/p/16937159.html

《基于深度学习算法的人脸识别应用研究》论文笔记十二
一、基本信息标题：基于深度学习算法的人脸识别应用研究时间：2021来源：厦门理工学院关键词：深度学习;人脸识别;卷积神经网络;级联网络;数据增强;二、研究内容问题定义：围......
《面向监控视频、复杂场景的人脸识别算法研究》论文笔记十三
一、基本信息标题：面向监控视频、复杂场景的人脸识别算法研究时间：2020来源：西南交通大学关键词：人脸识别;数据库清理和融合;神经网络;特征融合;二、研究内容问题定义：......
代码随想录算法训练营Day11|20. 有效的括号、1047. 删除字符串中的所有相邻重复项、15
代码随想录算法训练营Day11|20.有效的括号、1047.删除字符串中的所有相邻重复项、150.逆波兰表达式求值20.有效的括号题目链接：20.有效的括号字符串只包括'('，')'，'{......
10种经典排序算法的JavaScript实现方法
排序算法是《数据结构与算法》中最基本的算法之一。常见的一些排序算法有：插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。其中，冒泡排序......
‍面试官：工作两年了，这么简单的算法题你都不会？
技术推荐1、前端技术导航大全推荐：★★★★★地址：前端技术导航大全2、前端面试题库推荐：★★★★★地址：前端面试题库3、开发者颜色值转换工具推荐：★★★★★地址：开发......
最短路径Dijkstra算法
最短路径最短路径的性质:路径是有向的权重不一定等价于距离,权重也可以指时间,花费或者其他并不是所有顶点都是可达的负权重会使得问题更复杂(Dijkstra算法不适用于......
【算法训练营day21】LeetCode530.二叉搜索树的最小绝对差 LeetCode501. 二叉搜索树中
LeetCode530.二叉搜索树的最小绝对差题目链接：530.二叉搜索树的最小绝对差初次尝试利用二叉搜索树的性质：中序遍历的结果是有序递增数组，最后遍历该数组得到最小绝对差。c......
双指针算法
双指针算法大致格式如下：for(inti=0;i<n;i++){ while(j<i&&check(i,j))j++; //每道题目的具体逻辑}核心思想：for(inti=0;i<n;i++){ for(int......
图解实例讲解JavaScript算法，让你彻底搞懂
你好程序员，我们大多数人都害怕算法，并且从未开始学习它。但我们不应该害怕它。算法只是解决问题的步骤。今天让我们以简单和说明性的方式介绍主要算法。不要试图记住它们......
C#数据结构-七大查找算法
阅读目录1.顺序查找2.二分查找3.插值查找4.斐波那契查找5.分块查找6.树表查找7.哈希查找下面所有的代码，都已经经过vs测试。1.顺序查找基本思想：顺序查找也称为......