首页 > 其他分享 >VGG论文学习笔记(markdown格式)

VGG论文学习笔记(markdown格式)

时间:2024-10-12 18:17:59浏览次数:8  
标签:markdown 权重 模型 VGG 笔记 裁剪 图像 evaluation 尺度

vocab

  • back-propagation 反向传播
  • weight decay 权重衰减
  • gradient descent梯度下降
  • regularised by weight decay 权重衰减正则化
  • dropout ratio 率
  • conjecture 猜想
  • implicit regularisation 隐式正则化
  • circumvent规避
  • we sampled the weights from a normal distribution with the zero mean and 10−2 variance我们从均值为零、方差为 10-2 的正态分布中对权重进行了采样
  • fusion 融合 多用于model fusion

L2惩罚系数()

  • L2惩罚乘数设置为 5 × 1 0 − 4 5 \times 10^{-4} 5×10−4 是在深度学习模型训练中使用的一种正则化技术,也称为权重衰减。这种技术通过在损失函数中添加一个与权重的平方成比例的额外项来工作,以此来惩罚大的权重值。权重衰减有助于防止模型过拟合,因为它鼓励模型学习更小、更分散的权重,从而使模型更加简单,提高其泛化能力。

在数学上,L2惩罚项可以表示为:
L total = L + λ 2 ∑ i w i 2 L_{\text{total}} = L + \frac{\lambda}{2} \sum_{i} w_i^2 Ltotal​=L+2λ​i∑​wi2​
其中:

  • L L L是模型在数据上的原始损失。
  • λ \lambda λ 是正则化系数,也就是题目中提到的 (5 \times 10^{-4})。
  • w i w_i wi​ 是模型权重。
  • L total L_{\text{total}} Ltotal​ 是包含L2惩罚项的总损失。

在实际应用中,这个值是一个超参数,需要通过交叉验证等方法来调整以获得最佳模型性能。权重衰减的系数 ( \lambda ) 控制着正则化项的强度,较大的 ( \lambda ) 值会导致权重值更接近于0,而较小的值则允许模型有较大的权重值。

在某些情况下,L2正则化也被称为欧几里得范数惩罚,因为它是权重向量的欧几里得范数(L2范数)的平方。这种正则化方法在训练深度学习模型时非常常见,特别是在卷积神经网络(CNN)的训练中。

Scale jittering 尺度抖动

是一种数据增强技术,通常用于深度学习和计算机视觉任务中,尤其是在训练卷积神经网络(CNN)时。这种方法通过对图像进行随机缩放,然后裁剪到固定尺寸,以此来增加模型的泛化能力。在不同的研究和应用中,scale jittering 可能有不同的变体和应用方式。

Multi-scale evaluation 多尺度评估

多尺度评估(Multi-scale evaluation)是一种在不同尺度上评估模型性能的方法,它可以帮助研究者更好地理解模型在不同尺寸和复杂性级别上的表现。这种方法在计算机视觉和机器学习中尤其重要,因为它可以提供关于模型泛化能力的更多信息。

在目标检测任务中,多尺度评估通常涉及在不同尺度的图像上测试模型,以评估其对不同大小物体的识别能力。例如,一个模型可能在大尺寸物体上表现良好,但在小尺寸物体上表现不佳。通过在多个尺度上进行评估,研究者可以更好地理解模型的局限性,并探索改进的方法。

在深度学习模型的训练中,多尺度训练(multi-scale training)是一种常见的实践,它涉及在训练过程中使用不同尺寸的输入图像。这种方法可以提高模型的鲁棒性,使其能够处理各种尺寸的输入。相应地,多尺度测试(multi-scale testing)则涉及到在测试阶段使用不同尺度的图像来评估模型的性能。

Multi-crop evaluation多区域评估

Multi-crop evaluation 是一种在计算机视觉和深度学习中用于模型测试的数据增强技术。这种方法涉及在测试阶段将单一图像裁剪成多个区域(crops),然后对这些区域分别进行评估,最后将结果进行平均,以得到最终的预测输出。这样做的目的是为了模拟图像在不同位置和尺度下的视觉表现,增强模型的泛化能力。

在实际应用中,例如在VGG网络中,multi-crop evaluation 可以通过以下步骤进行:

  1. 将测试图像调整到不同的尺度。
  2. 从每个尺度的图像中,按照不同的区域(例如中心、四角等)裁剪出多个区域。
  3. 对这些裁剪出的区域进行模型预测。
  4. 对所有裁剪区域的预测结果进行平均,得到最终的预测输出。

例如,一种常见的做法是进行10-crop evaluation,即从原始图像的中心和四个角落裁剪出5个区域,并对每个区域及其水平翻转图像进行预测,最后取平均值作为最终结果。还有一种更细致的做法是144-crop evaluation,即在ImageNet数据集中,将图像调整到4个不同的尺度,然后从每个尺度中裁剪出3个区域(最左、正中、最右),并对每个区域及其水平翻转图像进行预测,总共得到144个预测结果,再取平均值 。

Multi-crop evaluation 的主要优点是能够提高模型对于图像中物体位置和尺度变化的鲁棒性,但它也意味着需要更多的计算资源来处理更多的图像区域。此外,这种方法还可以帮助减少过拟合,提高模型在实际应用中的性能 。

combined dense

"Combined dense"在深度学习和计算机视觉中,它通常指的是一种结合了密集连接网络(DenseNet)的架构,用于图像识别、分类等任务。DenseNet是一种深度卷积神经网络,它通过将每一层与前面所有层连接起来,来增强网络的信息流和参数效率。

在知识图谱领域,"Combined dense"可能指的是一种结合了关系感知特征和通用特征的嵌入方法,如在论文《ComDensE: Combined Dense Embedding of Relation-aware and Common Features for Knowledge Graph Completion》中所提出的。这种方法使用密集神经网络来提取知识图谱中的实体和关系的特征。

标签:markdown,权重,模型,VGG,笔记,裁剪,图像,evaluation,尺度
From: https://blog.csdn.net/a13478107907/article/details/142864719

相关文章

  • LeNet学习笔记(卷积+池化+relu
    练习题目将平均汇聚层替换为最大汇聚层,会发生什么?尝试构建一个基于LeNet的更复杂的网络,以提高其准确性。调整卷积窗口大小。调整输出通道的数量。调整激活函数(如ReLU)。调整卷积层的数量。调整全连接层的数量。调整学习率和其他训练细节(例如,初始化和轮数)。在MNIST数据......
  • RESTful 接口设计规范 笔记
    协议:API与用户的通信协议,http,https协议域名:eg:http://example.com版本:如果接口有版本的迭代的话,可以在域名后面拼接版本标识,eg:http://example.com/v1路径又称终点endpoint,表示api的具体网址在restful架构中,每个网址代表一种资源,所以网址中不能有动词,只使用名词且往往......
  • Express的使用笔记3 中间件
    日志中间件//挂载会每个接口都执行这段代码app.use((req,res,next)=>{console.log(req.method,req.url,Date.now())next()//下一个中间件})2.中间件的顺序很重要如果有一个普通接口写在上面代码之前,那么就不会进入上面的函数中但是如果在接口中第二个回调......
  • 前缀和笔记
    前缀和笔记对于一个一维数组a[m]其前i项和记作s[i]如果想要对a[m]中任意连续段的值进行求和,例如a[l]~a[r]则可使用前缀和数组进行o(n)计算inta[m],s[m];s[0]=0;//定义s[0]的值,防止边界问题for(inti=0;i<m;i++){ cin>>a[i]; s[i]=s[i-1]+a[i];}这样的话,s......
  • 阅读笔记一:软件构建的本质与重要性(代码大全2)
    阅读笔记一:软件构建的本质与重要性《代码大全2》让我们深刻认识到软件构建是软件开发的核心环节。软件构建并非简单的代码编写,它是一个综合性的过程。软件构建就像建造一座大厦,从蓝图设计到一砖一瓦的搭建,都需要精心规划和细致执行。在这个过程中,我们要将抽象的业务需求转化为......
  • vscode写markdown插入图片视频并放在指定目录
    目录前言正文前言各种云文档非常好用,但是当你想把这些资料保存在本地时,markdown我觉得是最好的选择markdown编辑器也有很多,但我还是觉得vscode最好用,直接粘贴文件就可以插入也类似云文档的使用体验,但是想要指定目录就需要设置一下正文我会想要文件放在md文件所在......
  • cmake使用笔记
    cmake_cxx_flags常用值在CMake中,CMAKE_CXX_FLAGS是一个用于指定C++编译器选项的变量。你可以将不同的编译选项添加到这个变量中,以影响编译过程的行为。以下是一些常用的CMAKE_CXX_FLAGS值及其说明:1.优化选项1.-O0:禁用优化(默认选项)。2.-O1:启用一级优化。3.-O2:启用二......
  • 关于C/CPP使用结构体中位域的一些笔记
    工作中软件通讯用到了结构体,在解析时,对应第一个变量在高位还是低位一直记不住。故计此博客作为笔记typedefstruct_stBin{ BYTEbOne:2; BYTEbTwo:2; BYTEbThree:2; BYTEbFour:2; _stBin() { bOne=0; bTwo=0; bThree=0; bFour=0; }}stB......
  • FFmpeg开发笔记(五十五)寒冬里的安卓程序员可进阶修炼的几种姿势
    ​喊了多年的互联网寒冬,今年的寒风格外凛冽,还在坚守安卓开发的朋友着实不容易。因为能转行的早就转了,能转岗的也早就转了,那么安卓程序员比较迷茫的就是,我该学什么安卓技术才好呢?还是直接扔了安卓再去搞别的技术吗?下面探讨下安卓程序员还能在哪些方面进阶修炼,主要有以下三个方向......
  • Markdown
    当然,有很多适合程序员编写文档并插入图片的编辑器。这些编辑器通常提供强大的文本编辑功能,同时支持插入图片、代码块、表格等丰富的内容元素。以下是一些推荐的编辑器:1.**VisualStudioCode(VSCode)**:-作为一个流行的代码编辑器,VSCode也支持Markdown格式的文档编写。......