深度学习网络中各名词是什么意思?

时间：2024-01-20 13:34:58浏览次数：29

标签：输出 backbone 名词 torch 网络 beta 深度输入

1 backbone

翻译为主干网络的意思，既然说是主干网络，就代表其是网络的一部分，那么是哪部分呢？翻译的很好，主干部分，哈哈哈哈，文字游戏了哈。这个主干网络大多时候指的是提取特征的网络，其作用就是提取图片中的信息，共后面的网络使用。这些网络经常使用的是resnet VGG等，而不是我们自己设计的网络，因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候，都是直接加载官方已经训练好的模型参数，后面接着我们自己的网络。让网络的这两个部分同时进行训练，因为加载的backbone模型已经具有提取特征的能力了，在我们的训练过程中，会对他进行微调finetune，使得其更适合于我们自己的任务。

2 head

head是获取网络输出内容的网络，利用之前提取的特征，head利用这些特征，做出预测。

3 neck

是放在backbone和head之间的，是为了更好的利用backbone提取的特征

4 bottleneck

瓶颈的意思，通常指的是网络输入的数据维度和输出的维度不同，输出的维度比输入的小了许多，就像脖子一样，变细了。经常设置的参数 bottle_num=256，指的是网络输出的数据的维度是256 ，可是输入进来的可能是1024维度的。

5 GAP

在设计的网络中经常能够看到gap这个层，我之前不知道是干啥的，后了解了，就是Global Average Pool全局平均池化，就是将某个通道的特征取平均值，经常使用AdaptativeAvgpoold(1),在pytorch中，这个代表自适应性全局平均池化，说人话就是将某个通道的特征取平均值self.gap= nn.AdaptiveAvgPool2d(1)

6 Embedding

深度学习方法都是利用使用线性和非线性转换对复杂的数据进行自动特征抽取，并将特征表示为“向量”（vector），这一过程一般也称为“嵌入”（embedding）

7 pretext task和downstream task

用于预训练的任务被称为前置/代理任务(pretext task)，用于微调的任务被称为下游任务(downstream task)

8 temperature parameters

在论文中经常能看到这个温度参数的身影，那么他都有什么用处呢？比如经常看到下面这样的式子：里面的beta就是temperature parameter，他在运算的时候起到什么作用呢？是这样的，他可以起到平滑softmax输出结果的作用，举例子如下：

import torch

x = torch.tensor([1.0, 2.0, 3.0])
y = torch.softmax(x, 0)
print(y)
x1 = x / 2  # beta=2
y = torch.softmax(x1, 0)
print(y)
x2 = x / 0.5  # beta=0.5
y = torch.softmax(x2, 0)
print(y)

# output
tensor([0.0900, 0.2447, 0.6652])
tensor([0.1863, 0.3072, 0.5065])
tensor([0.0159, 0.1173, 0.8668])

当beta>1的时候，可以将输出结果变得平滑，当beta<1的时候，可以让输出结果变得差异更大一下，更尖锐一些。如果beta比较大，则分类的crossentropy损失会很大，可以在不同的迭代次数里，使用不同的beta数值，有点类似于学习率的效果。

9 热身Warm up

Warm up指的是用一个小的学习率先训练几个epoch，这是因为网络的参数是随机初始化的，一开始就采用较大的学习率容易数值不稳定。

10 end to end

在论文中经常能遇到end to end这样的描述，那么到底什么是端到端呢？其实就是给了一个输入，我们就给出一个输出，不管其中的过程多么复杂，但只要给了一个输入，就会对应一个输出。比如分类问题，你输入了一张图片，肯定有网络有特征提取，全连接分类，概率计算什么的，但是跳出算法问题，单从结果来看，就是给了一张输入，输出了一个预测结果。End-To-End的方案，即输入一张图，输出最终想要的结果，算法细节和学习过程全部丢给了神经网络。

11 domain adaptation 和domain generalization 域适应和域泛化

域适应中，常见的设置是源域D_S完全已知，目标域D_T有或无标签。域适应方法试着将源域知识迁移到目标域。第二种场景可以视为domain generalization域泛化。这种更常见因为将模型应用到完全未知的领域，正因为没有见过，所以没有任何模型更新和微调。这种泛化问题就是一种开集问题，由于所需预测类别较多，所以比较头疼

标签：输出,backbone,名词,torch,网络,beta,深度,输入
From： https://www.cnblogs.com/smalldong/p/17976357

10种经典神经网络结构优缺点
十种常见的CNN架构LeNet优点：是最早的卷积神经网络之一，对于手写数字识别等小规模图像分类任务表现良好。缺点：对于大规模图像数据集或高维数据处理能力有限。应用场景：手写数字识别、简单的图像分类任务。AlexNet优点：引入了ReLU激活函数和Dropout技术，大幅提高了网络的准确性和稳定性......
详细教程：AutoDL如何配置深度学习环境？
摘要：本文在AutoDL提供的JupyterLab中配置了深度学习环境。首先创建了base环境，然后创建了自己的环境（命名为x9py38），并在x9py38环境中安装了一些深度学习包，具体包括PyTorch、jupyterd2l和ipykernel。一、创建环境进入JupyterLab，具体操作如图所示。进入终端。在终端中输入v......
Java爬虫在网络数据抓取方面有什么优势和不足
Java爬虫是一种常用的网络数据抓取工具，它能够自动化地从网页中提取和解析数据。本文将介绍Java爬虫在网络数据抓取方面的优势和不足。一、Java爬虫的优势1.多线程支持：Java语言天生支持多线程，可以使用多线程技术提高爬虫的并发能力，加快数据抓取速度。2.丰富的第三方库：Java拥有丰富的......
excel宏-表格通过图片的网络路径下载展示图片
1、原理通过图片的网络路径，将图片下载到本地，excel读取本地路径，显示图片。注意：下载的图片路径改变将无法展示2、准备2.1、excel版本MS_Office_20162.2、excel开启宏选项-》信任中心-》信任中心设置-》宏设置-》启用所有宏2.3、另存为宏文件表格数据另存为宏文件......
Kubernetes容器实践操作深度解析
Kubernetes容器实践深度解析引言在当今云原生时代，容器技术已经成为构建、部署和管理应用程序的关键工具之一。而在众多的容器编排系统中，Kubernetes（简称K8s）因其强大的自动化、弹性和可扩展性而备受欢迎。本文将深入探讨Kubernetes容器实践，从基础概念到高级应用，为读者提供全面的指南......
医疗领域：合成数据、生成对抗网络、数字孪生的应用
PrimiHub一款由密码学专家团队打造的开源隐私计算平台，专注于分享数据安全、密码学、联邦学习、同态加密等隐私计算领域的技术和内容。在医疗保健领域，每当研究人员想要用患者的数据进行大数据分析时，就不得不考虑患者数据的访问与保证数据安全之间的平衡。以前我们没办法，现在我......
常见网络安全威胁及攻击类型介绍!
在当今社会，网络安全是重要的议题，无论是个人还是企业对此都高度重视。而想要有效防护网络安全，我们必须对网络安全威胁及攻击类型进行了解，这样才可以更好地进行防护，做到防患于未然。本文为大家介绍一下常见网络安全威胁及攻击类型，希望对大家有所帮助。1、病毒病毒是一种......
神经网络优化篇：详解Adam 优化算法(Adam optimization algorithm)
Adam优化算法在深度学习的历史上，包括许多知名研究者在内，提出了优化算法，并很好地解决了一些问题，但随后这些优化算法被指出并不能一般化，并不适用于多种神经网络，时间久了，深度学习圈子里的人开始多少有些质疑全新的优化算法，很多人都觉得动量（Momentum）梯度下降法很好用，很难再想出更好......
【新手友好】用Pyspark和GraphX解析复杂网络数据
从零开始在本文中，我们将详细介绍如何在Python/pyspark环境中使用graphx进行图计算。GraphX是Spark提供的图计算API，它提供了一套强大的工具，用于处理和分析大规模的图数据。通过结合Python/pyspark和graphx，您可以轻松地进行图分析和处理。为了方便那些刚入门的新手，包括我自己......
网络流
最大流1.最大流定义自行意会。原理找一条\(S-T\)的正权路径，给里面加流量。显然是错的，但是可以再存反边，类似一种反悔的思想。其最大流量为\(0\)。此处的边权皆为空余流量。实现EK/FF用DFS、BFS打暴力。ISAP预处理每个点到\(T\)的反图最短路（实际无必要），以此分层，DF......