大数据技术与应用课堂测试 -神经网络计算过程

时间：2024-04-10 09:02:15浏览次数：19

标签：函数梯度非线性网络传播神经网络测试课堂

石家庄铁道大学2024年春季

2021 级大数据技术与应用课堂测试

-神经网络计算过程

课程名称：大数据技术与应用任课教师：王建民

1、用自己的话说明深度学习训练三部群正向传播，反向传播，梯度下降的基本功能和原理。

（1）正向传播是输入数据通过神经网络，从输入层流向输出层的过程。在正向传播中，这一层的神经元接收上一层的输出，再进行加权求和、计算激活函数，然后将结果传给下一层。这个过程一直持续到达输出层，产生网络的预测结果。

（2）反向传播是通过计算损失函数对网络参数的梯度来调整参数，使得网络的预测结果更加接近真实标签。首先，通过比较网络预测值和真实标签计算出损失函数的值。然后，反向传播算法利用链式法则从输出层向输入层传播梯度，计算损失函数对每个参数的梯度。最后，利用这些梯度信息更新网络参数，以减小损失函数的值。

（3）梯度下降是一种优化算法，用于最小化损失函数。在深度学习中，通常使用反向传播计算损失函数对参数的梯度。然后，根据梯度的反方向，以一定的步长（学习率）更新参数，使得损失函数逐渐减小。这个过程一直持续迭代，直到达到预定的停止条件，如达到最大迭代次数或损失函数收敛到某个阈值。

2、请问人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

（1）ReLU的计算速度更快，因为它只涉及简单的阈值比较和取最大值的操作。相比之下，sigmoid和tanh函数需要进行指数运算，这在计算上更为复杂，特别是在处理大型深度网络时，ReLU可以节省大量的计算资源。

（2）sigmoid和tanh函数在输入值过大或过小时，其导数会变得非常接近0，这会导致反向传播中的梯度消失问题。梯度消失意味着在深层网络中，通过多个sigmoid或tanh层传播梯度时，梯度会逐渐变得非常小，导致网络训练变得非常缓慢，甚至无法收敛。而ReLU在正数部分保持导数为1，这有助于解决梯度消失问题，使网络训练更加高效。

（3）ReLU的一个关键特性是它可以使网络具有稀疏性。在ReLU中，负数部分被截断为0，所以在每个神经元上只有一部分激活。这种稀疏性有助于减少神经网络的过拟合风险，因为每个神经元都在处理少量信息，从而降低了模型的复杂度。此外，这种分段线性性质使得网络能够逐渐构建复杂的非线性表示能力。综上所述，ReLU因其计算效率、对梯度消失问题的缓解以及稀疏激活性等特点，在人工神经网络中通常比tanh和sigmoid函数更具优势。然而，不同的激活函数在不同的应用场景中可能有不同的表现，因此在实际应用中需要根据具体任务和网络结构来选择合适的激活函数。

3、为什么引入非线性激励函数？

（1）神经网络的堆叠层如果只包含线性变换，整个网络仍然只能实现线性变换，无法学习复杂的非线性关系。通过引入非线性激活函数，可以使网络能够学习和表示更复杂的非线性关系，提高网络的表达能力。

（2）在深层神经网络中，如果只使用线性激活函数，梯度会随着网络的深度逐渐消失，导致训练困难。非线性激活函数可以通过保持梯度不至于过小，有助于缓解梯度消失问题，使得深层网络更容易训练。

（3）非线性激活函数可以引入更多的非线性特征，使得神经网络可以更好地适应复杂的输入数据分布，提高了网络的表达能力和泛化能力。

（4）非线性激活函数可以帮助网络更快地收敛到合适的解，提高了网络的稳定性和训练速度。

4、根据样例：

计算出模型正向传播、反向传播的各个神经元的输入与输出。模型中的非线性函数采用Relu，方向传播的损失函数结果为Y。

其中 X₁=1，X₂= -1，要求计算Z_1, Z_2, Z_3，并写出计算过程。

Z_1 = X1*(W_1)+X2*(W_2) = 1*1-1*2= -1

Z_2 = X1*(W_3)+X2*(W_4) = -1*1-1*1 = -2
a_1=1/(1+e^(-Z_1))=1/(1+e^1)=0.2689
a_2=1/(1+e^(-Z_2))=1/(1+e^2)=0.1192
Z_3=(W_5)*(a_1) +(W_6)*(a_2)=0.3881
y=1/(1+e^(-Z_3))=1/(1+e^(-0.3881))=0.5958

标签：函数,梯度,非线性,网络,传播,神经网络,测试,课堂
From： https://www.cnblogs.com/DREAM2021/p/18125294

神经网络课堂测试
石家庄铁道大学2024年春季 2021级大数据技术与应用课堂测试-神经网络计算过程课程名称：大数据技术与应用任课教师：王建民 1、用自己的话说明深度学习训练三部群正向传播，反向传播，梯度下降的基本功能和原理。 2、请问人工......
4月10课堂测试
用自己的话说明深度学习训练三部群正向传播，反向传播，梯度下降的基本功能和原理。正向传播：正向传播是指输入数据通过神经网络的各个层，最终得到输出结果的过程。在正向传播中，每一层的神经元将输入数据进行加权求和，并经过激活函数处理后传递给下一层。神经网......
Node.js毕业设计基于翻转课堂教学模式的小学英语微课互动平台（Express+附源码）
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：在当前的教育领域，随着信息技术的飞速发展和互联网的普及，传统的教学模式正在逐渐被新型的、更为灵活和互动性强的在线教学模式所取代。翻转课堂作为一种新型......
ARM异构集群组建与通信性能测试
ARM异构集群组建与通信性能测试1介绍本研究以树莓派、飞腾派、米尔海思三款ARM开发板为基础，组建计算集群，在其上运行实时性测试程序，并结合交换机实现板间通信。2系统编译与加载计划在下述开发板+系统上运行编译好的ARM程序：序号开发板系统状况2.1树莓派原生Rasp......
基于樽海鞘群算法优化的广义回归神经网络(GRNN)预测
基于樽海鞘群算法优化的广义回归神经网络(GRNN)预测文章目录基于樽海鞘群算法优化的广义回归神经网络(GRNN)预测1.GRNN神经网络概述2.GRNN的网络结构3.GRNN的理论基础4.数据集5.樽海鞘群算法优化GRNN6.实验结果7.Matlab代码摘要：本文介绍基于樽海鞘群算法优化的广......
UI自动化测试案例
备注：本文为博主原创文章，未经博主允许禁止转载。如有问题，欢迎指正。个人笔记（整理不易，有帮助点个赞）笔记目录：笔记本~笔记目录_airtest和selenium那个好用-CSDN博客个人随笔：工作总结随笔_8、以前工作中都接触过哪些类型的测试文档-CSDN博客案例，在“直播吧”app，实现自动化点击......
大数据技术与应用课堂测试-数据清洗同步
一、数据结构分析：（1）京津冀三省的2015年度的科技成果数据原始表，为Access数据库，；（2）要求将三省的科技成果数据汇总到同一表中（要求结果表为MySql数据表）；（3）三个原始数据表结构不一致，要求结果表中包括所有的字段，表达意思相同或相似的字段要进行合并，不允许丢失字段（若只有本表独有字段，......
5.Pytest自动化测试框架（2）
[email protected]装饰器及执行级别作用：相当于Jemeter中的setup和teardown函数setup:在所有方法之前执行teardown:在所有方法之后执行importpytest#装饰器，声明下面的函数是setup函数，即会在所有方法之前执行#scope参数：可省略，缺省值默认是function级别#function:......
面试常问问题——web端测试、安卓测试、ios测试的区别是什么？
web端需要考虑：1、浏览器种类的兼容2、浏览器版本的兼容3、电脑和显示器的显示4、缩放窗口大小的显示5、响应时间 app测试需要考虑：1、不同的屏幕分辨率2、不同品牌的设备3、不同的系统4、不同的安卓版本5、安装卸载......
【攻防实操系列+内网渗透】--第1章：内网渗透测试基础①
内网也指局域网(LocalAreaNetwork,LAN),是指在某一区域内由多台计算机互连而成的计算机组，组网范围通常在数千米以内。在局域网中，可以实现文件管理、应用软件共享、打印机共享、工作组内的日程安排、电子邮件和传真通信服务等。内网是封闭的，可以由办公室内的两台计算机组成,也......

大数据技术与应用课堂测试 -神经网络计算过程

相关文章

赞助商

阅读排行