神经网络与深度学习课程总结一

时间：2024-04-01 16:47:43浏览次数：35

标签：输出函数 Sigmoid 感知机神经网络课程深度线性 theta

线性回归

定义与基本概念：线性回归用于确定变量间相互依赖的定量关系，是一种统计分析方法。以房屋面积与销售价格的关系为例，通过拟合一条直线（模型）来预测未知面积的房屋价格。
数学模型：模型表示为 $y = h_{\theta}(x) = \theta^Tx + \theta_0$，其中 $x$ 和 $y$ 分别是输入和输出，$\theta$ 表示模型参数。
代价函数：$J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_{\theta}(x^{(i)}) - y^{(i)})^2$，目标是最小化代价函数。
解析解：通过求解 $\nabla_{\theta} J(\theta) = 0$ 得到参数的解析解 $\theta = (X^TX)^{-1}X^Ty$。

线性二分类问题

基本概念：线性分类通过特征的线性组合进行分类决策，例如通过直线或超平面分割不同类别的样本。
Sigmoid函数：用于将线性函数的输出转换为概率值，形式为 $\sigma(z) = \frac{1}{1 + e^{-z}}$。
代价函数：与线性回归相似，但引入了Sigmoid函数处理分类问题。

对数回归与多分类回归

对数回归：使用Sigmoid函数处理二分类问题，输出为{0,1}。代价函数采用交叉熵损失。
多分类回归（Softmax回归）：处理多类别的分类问题，使用Softmax函数将线性函数的输出转换为各类别的概率分布。

神经元模型

M-P模型：1943年由McCulloch和Pitts提出的神经元模型，是神经网络的基础。
作用函数：介绍了非对称型Sigmoid函数和对称型Sigmoid函数等，用于模拟神经元的激活过程。

感知机模型

原理与模型：感知机是一种简单的线性二分类模型，通过迭代优化模型参数来分割不同类别的样本。
训练过程：感知机通过迭代调整权重，直到找到能够正确分类所有训练样本的超平面。

多层感知机

多层感知机解决了单层网络（如感知机）无法解决的线性不可分问题，例如XOR问题。
通过引入至少一层隐藏层，多层感知机可以实现任意复杂度的函数逼近。
数学表述：
- 激活函数用于隐层节点，如Sigmoid函数 $ \sigma(z) = \frac{1}{1 + e^{-z}} $，使网络能逼近非线性函数。
- 输出表达式：$ y = \sigma(w_2 \sigma(w_1 x + b_1) + b_2) $ ，其中$x$是输入，$y$是输出，$w_1，w_2$是权重，$b_1，b_2$是偏置项。

BP算法

BP算法是一种训练多层前馈神经网络的方法，通过正向传播输入信号，并通过反向传播误差信号来调整权值和阈值。
正向传播：输入信号从输入层经过隐藏层传递到输出层，如果输出层的输出与期望的输出相符，则结束学习过程；否则，进入反向传播。
反向传播：计算输出与实际值之间的误差，并将误差沿网络反向传播，利用梯度下降法更新每层的权重和偏置，以减小网络的预测误差。
数学表述：
- 误差函数：$ E = \frac{1}{2} \sum (y_{actual} - y_{predicted})^2 $ ，其中$ E $表示网络的总误差。
- 权重更新：$ \Delta w = -\eta \frac{\partial E}{\partial w} $ ，$\eta$是学习率，$\Delta w $是权重的调整量。

算法优缺点

优点：可以自主学习，逼近任意非线性函数。
缺点：算法可能不会全局收敛，收敛速度可能慢，需要合理选择学习率，神经网络的设计（如层数和每层的节点数）具有挑战性。

标签：输出,函数,Sigmoid,感知机,神经网络,课程,深度,线性,theta
From： https://www.cnblogs.com/laylow/p/18108814

【课程设计/实训作业】python学生成绩管理系统源码
项目介绍一直想做一款学生成绩管理系统，看了很多优秀的开源项目但是发现没有合适的。于是利用空闲休息时间开始自己写了一套管理系统。学习过程中遇到问题可以咨询评论。在线体验http://score.gitapp.cn/（账号：admin123密码：admin123）源码地址https://github.com/geeeeeee......
探索GaussDB(DWS)湖仓融合：Hudi与元数据打通的深度解析
华为云数仓GaussDB(DWS)研发专家高若岳老师，深入解析GaussDB(DWS)数据仓库如何与大数据生态快速对接。随着智能数据时代的到来，数据量爆发式增长，数据形态呈海量化和多样化发展，不再是单一的结构化数据。从海量和多样化的数据做融合分析，创造更多业务价值的诉求日益强烈。在本期《Ga......
深度学习编译综述
TheDeepLearningCompiler:AComprehensiveSurveyhttps://arxiv.org/pdf/2002.03794.pdf研究背景深度学习编译是深度学习模型与硬件之间的桥梁深度学习编译器通用设计框架高级IR：表示计算和控制流，体系架构无关低级IR：描述指令细节特性，体系架构相关前端：将深度学习模......
故障诊断模型 | 基于LSTM长短期记忆神经网络的滚动轴承故障诊断（Pytorch）
概述LSTM（LongShort-TermMemory）是一种常用的循环神经网络（RNN），在时间序列数据处理任务中表现优秀，可用于滚动轴承故障诊断。滚动轴承故障通常会导致振动信号的变化，这些振动信号可以被视为时间序列数据。LSTM能够捕捉时间序列之间的依赖关系，从而对滚动轴承的故障进行诊断。......
故障诊断模型 | 基于多信号融合和改进的深度卷积生成对抗网络的不平衡数据故障诊断方
文章目录文章概述模型描述参考资料文章概述本文提出了一种解决数据不平衡问题并提高诊断准确性的诊断方法。首先，通过小波变换处理来自多个传感器的信号，以增强数据特征，然后通过池化和拼接操作对其进行压缩和融合。随后，构建改进的对抗网络来生成新的样本进......
深度学习理论基础（二）神经网络基础篇
目录一、基础知识点Ⅰ参数部分Ⅱ模型部分二、普通神经网络模型搭建1.准备数据集2.划分数据集3.搭建模型4.训练网络5.测试网络6.保存与导入模型神经网络通过学习大量样本的输入与输出特征之间的关系，以拟合出输入与输出之间的方程，学习完成后，只给它输入特......
【部分内容摘录】深度学习（人工智能）：大模型的微调方法
原文地址：http://www.cn-witmed.com/list/34/9555.html模型微调的基本思想是使用少量带标签的数据对预训练模型进行再次训练，以适应特定任务。在这个过程中，模型的参数会根据新的数据分布进行调整。这种方法的好外在于，它利用了预训练模型的强大能力，同时还能够适应新的数据分布。......
毕业设计：基于深度学习的厨房穿戴识别系统卷积神经网络
目录前言一、课题背景与意义二、设计思路2.1.图像分类2.2.目标检测三、模型训练3.1实验环境3.2结果分析最后前言 ......
毕业设计：基于卷积神经网络的短文本分类算法系统
目录前言项目背景数据集设计思路更多帮助前言 ......
毕业设计：基于深度学习的宠物狗种类识别人工智能 YOLO
目录前言项目背景数据集设计思路更多帮助前言 ......

神经网络与深度学习课程总结一

线性回归

线性二分类问题

对数回归与多分类回归

神经元模型

感知机模型

多层感知机

BP算法

算法优缺点

相关文章

赞助商

阅读排行