一、深度学习相关理论

1.神经网络概述

2. 卷积神经网络CNN

①卷积层——计算方法是大矩阵内部×小矩阵=较小矩阵，作用是特征提取

②池化层——计算方法是大矩阵通过选取最大值或是平均值变成小矩阵，作用是降维、提高计算效率

3. 激活函数——将输入信号转换为非线性的形式，使神经网络能够表示复杂的非线性关系，除此之外，还可以限制输出范围、缓解梯度消失问题

①Sigmoid函数——适用于二分类问题

②Tanh激活函数——常用于隐藏层中，尤其在循环神经网络（RNN）和长短期记忆网络（LSTM）等结构中。然而，由于其存在梯度消失的问题，有时候也会被其它激活函数如 ReLU 所取代

③ReLU激活函数——计算简单，可以缓解梯度消失

二、注意力机制

标签：函数,梯度,理论,矩阵,ReLU,学习,神经网络,深度,激活
From： https://www.cnblogs.com/AvavaAva/p/18173521

网课-博弈论学习笔记
Nim游戏\(n=2\)的时候可以用一个巧妙的方法证明：如果两堆石子一样多，则后手可以通过在另一堆上一直模仿先手的行为获胜；如果两堆石子不一样多，则先手可以在第一次取时把两堆变成一样多。结论中出现异或的原因（异或的定义为）：\[a\oplus0=a\]\[a\oplusa=0\]\[a\oplusb=......
PHP-数据对象学习手册（全）
PHP数据对象学习手册（全）原文：zh.annas-archive.org/md5/33ff31751d56930c46ef1daf9ca0ebcb译者：飞龙协议：CCBY-NC-SA4.0前言本书将向您介绍PHP5.0版本开始提供的最重要的扩展之一——PHP数据对象，通常称为PDO。PHP由于其简单性和易用性而成为非常流行的Web编程语言......
8086 汇编学习 Part 9
端口的读写CPU的邻居CPU内部的寄存器内存单元端口（各种接口卡、网卡，显卡，主板上的接口芯片等）各种芯片工作时，都有一些寄存器由CPU读写从CPU角度，将各寄存器当端口，并统一编制CPU用统一的方法与各种设备通信读写端口的指令在对\([0,255]\)的端口进行读写时，端口......
计算理论导论笔记
计算理论导论笔记正则语言和自动机（RegularLanguagesandAutomata）DFA确定性有限状态自动机（DeterministicFinitestateAutomata/DFA）由一个五元组\((Q,\Sigma,\delta,q_0,F)\)唯一确定。\(Q\)为状态集合。\(\Sigma\)为字符集。\(\delta:Q\times\Sigma\toQ\)为状态转......
Go-编程学习手册（全）
Go编程学习手册（全）原文：zh.annas-archive.org/md5/5FC2C8948F5CEA11C4D0D293DBBCA039译者：飞龙协议：CCBY-NC-SA4.0前言Go是一种开源编程语言，让程序员可以轻松构建可靠且可扩展的程序。它通过提供简单的语法来实现这一点，使得使用并发习语和强大的标准库编写正确且可预测的代......
Go-Web-开发学习手册（全）
GoWeb开发学习手册（全）原文：zh.annas-archive.org/md5/2756E08144D91329B3B7569E0C2831DA译者：飞龙协议：CCBY-NC-SA4.0前言感谢您购买本书。我们希望通过本书中的示例和项目，您能从GoWeb开发新手变成一个能够承担面向生产的严肃项目的人。因此，本书在相对较高的水平上涉及......
Pick's Theorem 学习笔记
Pick'sTheorem学习笔记UVA10088题目传送门题意：顺时针或逆时针地给出一个\(n\)个顶点（顶点都是整点）的简单多边形，求这个多边形内部的整点数量（位于多边形形上的整点不算）。Pick'sTheorem对于一个顶点都是整点的简单多边形：令\(I\)为多边形内部的整点数量，\(B\)为多边形形上......
学习笔记：矩阵乘法
矩阵乘法引入如果\(C=AB\)，则\(c_{ij}=\sum\limits_{k=1}^{n}a_{ik}\cdotb_{kj}\)，即\(A\)的第\(i\)行与\(B\)的第\(j\)列的点积。假设有\(n\)个地点，\(i\)到\(j\)做飞机有\(a_{ij}\)种选择，坐火车有\(b_{ij}\)种选择。求从\(i\)先做飞机再坐火车到......
《深度学习原理与Pytorch实战》（第二版）（二）
第6章手写数字加法器——迁移学习迁移学习允许训练集和测试集的数据有不同的分布、目标、领域；而一般的监督学习要求训练集和测试集上的数据有相同的分布特性一个有意思的想法：大公司运用大数据训练大模型，再将这些模型迁移到小公司擅长的特定垂直领域中，这样就可以将泛化的大模......
Manacher 学习笔记
Manacher是一个求出一个字符串中所有回文子串的利器。记录方法首先我们发现一个问题，一个长为\(S\)的字符串一共有\(S^2\)个子串，所以记录回文子串时不可能记录左右端点。如何解决呢？根据回文串的特点，我们发现，一个回文串，将它的两端各删去一个字符，那么它还是一个回文串。所以我......

深度学习相关理论

一、深度学习相关理论

1.神经网络概述

2. 卷积神经网络CNN

①卷积层——计算方法是大矩阵内部×小矩阵=较小矩阵，作用是特征提取

②池化层——计算方法是大矩阵通过选取最大值或是平均值变成小矩阵，作用是降维、提高计算效率

3. 激活函数——将输入信号转换为非线性的形式，使神经网络能够表示复杂的非线性关系，除此之外，还可以限制输出范围、缓解梯度消失问题

①Sigmoid函数——适用于二分类问题

②Tanh激活函数——常用于隐藏层中，尤其在循环神经网络（RNN）和长短期记忆网络（LSTM）等结构中。然而，由于其存在梯度消失的问题，有时候也会被其它激活函数如 ReLU 所取代

③ReLU激活函数——计算简单，可以缓解梯度消失

二、注意力机制

相关文章

赞助商

阅读排行