【AI学习笔记4】四种主流的神经网络 FNN、RNN、CNN、Transformer

标签：Transformer RNN AI 模型神经网络 https CNN

最常用的人工神经网络（Artificial Neural Network，ANN）主要包括以下四种：前馈神经网络（Feedforward Neural Network，FNN）、循环神经网络（Recurrent Neural Network，RNN）和卷积神经网络（Convolutional Neural Network，CNN），还有当前最流行的大模型常用的Transformer神经网络。不同模型的网络具有不同的结构和特点，适用于解决不同类型的任务。【1】

前馈神经网络（FNN）

前馈神经网络FNN是一种最基础的神经网络模型，其特点是每个神经元的输出只传给下一层的神经元。信息处理是从输入层到输出层单向的，适合于解决分类和回归等问题。【1】

FNN相关的概念：

感知机——（Perceptron）。

多层感知机——MLP（Multilayer Perceptron），包含一个输入层、一个或多个隐藏层和一个输出层。

全连接神经网络详解——FCNN（Full Connect Neural Network），当前层的每个神经元都会接入前一层每个神经元的输入信号。

深度神经网络——DNN（Deep Neural Networks）。

一个典型的MLP网络：【2】

循环神经网络
循环神经网络RNN是一种能够处理序列数据的神经网络模型，在网络中引入了循环结构，使得每个神经元不仅能够接收来自上一层的输入，还能够接收来自同一层的输入。

RNN主要用于解决序列预测和语言建模等问题，可以细分为RNN、LSTM（Long Short-Term Memory）、GRU（Gated Recurrent Unit）等。其中LSTM是最常用的循环神经网络之一，它通过引入门控机制和记忆单元，有效解决了传统RNN存在的梯度消失（vanishing gradient）和梯度爆炸（exploding gradient）等问题。【1】

一个典型的RNN网络：【3】

卷积神经网络
卷积神经网络CNN是一种专门用于处理图像数据的神经网络模型，其特点是在网络中引入了卷积层（Convolutional Layer）和池化层（Pooling Layer）等结构，提取出图像的特征信息。最后会接一个全连接层（Fully Connected Layer）分类得到output。
CNN主要用于解决图像分类和目标检测等问题，可细分为LeNet、AlexNet、VGGNet、GoogLeNet、ResNet等。其中ResNet通过引入残差结构，有效解决了深度神经网络训练过程中存在的梯度消失和梯度爆炸等问题，取得了在图像分类任务上的优秀表现。【1】

一个典型的CNN网络：【4】