李宏毅《机器学习》总结 - 2022 HW3（图像识别、CNN） Strong Baseline

时间：2024-01-31 19:44:48浏览次数：37

标签：Baseline nn 李宏毅 ReLU 64 2022 128 512 out

调参调吐了。。最好做到了 private 0.82 / public 0.808
这题前前后后做了五天。。主要是后来 train 一次就得花很长很长时间，我的 kaggle 余额也用的差不多了。。

这个题目大概就是给你 11 种食物的图片，让你学习，并分类

CNN

处理图片就先转化成 \(128\times 128\) 个 pixel，然后做 CNN。pytorch 的卷积层长这样：

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)

前面两个可以理解成原来的图为 \(\mathit{in}\times N\times N\)，卷积之后变成 \(\mathit{out}\times N\times N\)
kernel 就是 filter 的大小，stride 就是 filter 每次移动的步长，padding 就是移动出去之后填充的数字
做完卷积之后通常接一个batch normalization，防止 gradient exploding/vanishing
为了减少运算，一般再加一个池化层，设成 \(2\times 2\)

class Classifier(nn.Module):
   def __init__(self):
       super(Classifier, self).__init__()
       # torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding)
       # torch.nn.MaxPool2d(kernel_size, stride, padding)
       # input 維度 [3, 128, 128]
       self.cnn = nn.Sequential(
           nn.Conv2d(3, 64, 3, 1, 1),  # [64, 128, 128]
           nn.BatchNorm2d(64),
           nn.ReLU(),
           nn.MaxPool2d(2, 2, 0),      # [64, 64, 64] 
          

           nn.Conv2d(64, 128, 3, 1, 1), # [128, 64, 64]
           nn.BatchNorm2d(128),
           nn.ReLU(),
           nn.MaxPool2d(2, 2, 0),      # [128, 32, 32]
         
           nn.Conv2d(128, 256, 3, 1, 1), # [256, 32, 32]
           nn.BatchNorm2d(256),
           nn.ReLU(),
           nn.MaxPool2d(2, 2, 0),      # [256, 16, 16]

           nn.Conv2d(256, 512, 3, 1, 1), # [512, 16, 16]
           nn.BatchNorm2d(512),
           nn.ReLU(),
           nn.MaxPool2d(2, 2, 0),       # [512, 8, 8]
           
           nn.Conv2d(512, 512, 3, 1, 1), # [512, 8, 8]
           nn.BatchNorm2d(512),
           nn.ReLU(),  
           nn.MaxPool2d(2, 2, 0),       # [512, 4, 4]
       )
       self.fc = nn.Sequential(
           nn.Dropout(0.4),
           nn.Linear(512*4*4, 1024),
           nn.ReLU(),
           nn.Linear(1024, 512),
           nn.ReLU(),
           nn.Linear(512, 11)
       )

   def forward(self, x):
       out = self.cnn(x)
       out = out.view(out.size()[0], -1)
       return self.fc(out)

然后结合一下 ensemble，简单来说就是跑好几次这个模型，testing 预测的时候取 argmax，也叫做 k-fold，这里我让 \(k=4\)
还有就是 cross validation，由于是 4-fold，我每次重新划分训练集和验证集，具体的可以先把所有的训练资料存起来，然后每一轮训练的时候重新划分。
这样跑几轮，大概 2、3 个小时（当时我让 \(epoch=25\)），就跑出来 private 0.77 / public 0.79（~~所以后来四天我就让 public 提升了 0.02？~~）

感觉到 strong baseline 就只需要把训练时间延长就行了，也试了不同的模型 & loss 函数，感觉差距也不是很大。单个模型延长到 \(epoch=100\)，1-fold 跑出来就 0.78 了

又跑了将近 20 个小时，跑出来 4-fold 就是 private 0.82 了

标签：Baseline,nn,李宏毅,ReLU,64,2022,128,512,out
From： https://www.cnblogs.com/SkyRainWind/p/17999957

P8353 [SDOI/SXOI2022] 无处存储
存下每个点的父亲信息\(fa\)和点权\(w\)就已经用去近\(54\text{MiB}\)了，树剖似得彻彻底底。考虑树分块：随机选定\(\sqrtn\)个点作为关键点建虚树，这样每个点向上走到关键点的步数期望为\(\sqrtn\)，然后每个关键点存原树上从它到它虚树上的父亲结点的信息。dfs似了，......
Windows server 2022 安全基线加固安全加固仅供参考
WindowsRegistryEditorVersion5.00[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\TerminalServer\WinStations\RDP-Tcp]"PortNumber"=dword:0000045a[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters]"Dis......
[NOI2022] 移除石子
[NOI2022]移除石子题目描述你正在玩一个名为“移除石子”的小游戏。有\(n\)堆石子排成一行，第\(i\)堆有\(a_i\)枚，你的任务是通过如下的操作将所有石子移除：操作一：选择一堆石子，将其中的至少\(2\)枚石子移除；操作二：选择一个连续的编号区间\([l,r]\)（\(1\lel\ler\l......
李宏毅《机器学习》总结 - Transformer
前言当时老师要求我做transformer和self-attention的ppt，结果当时在训练ACM没大有时间，就弄了个质量不高的，不出意外的被喷了。。。现在回头看看当时做的整体没有大问题，但是由于知识没有连贯起来导致有些地方没有提到，也没有形成一个比较完整的架构。Transformer能做的任务......
Visual Studio 2022 + Qt 中文乱码问题
使用Qt编译中文标题出现乱码问题如下图首先打开文件属性->点击(C/C++)->点击（所有选项）->找到（附加选项）这一栏修改为（/UTF-8）注意大小写然后在头文件中添加以下代码：1#if_MSC_VER>=16002#pragmaexecution_character_set("utf-8")3#endif即可解决问题......
P8352 [SDOI/SXOI2022] 小 N 的独立集
还是先打暴力，枚举\(k^n\)种树的形态做树形DP，时间复杂度\(\mathcalO(nk^n)\)，拿下\(n\le8\)和\(k=1\)的\(25\)分。虽然很简单，还是交代下吧：设\(f(u,0/1)\)表示以\(u\)为根的子树中是否选\(u\)的最大权独立集，\(f(u,0)\getsw_u+\sum\limits_{v\inson_u}......
（二）VS2022启动项目调试显示“正在加载......的符号”的解决方法
之前重来没有遇到过的问题，自从安装了VS2022后，每次调试都会显示“正在加载......”的弹框，虽然对程序没有多大影响，但是这种体验非常不友好，于是找了许多方法，下面是亲测有效的方法：一、检查“工具”》“选项”》“调试”》“符号”是否去√。二、检查“工具”》“选项”》“调试”......
P8350 [SDOI/SXOI2022] 进制转换
记\(len_x\)为\(x\)在\(a\)中出现的次数，显然有\(\mathcalO(nq)\)的暴力，拿下\(20\)分。感觉用数据结构难以维护，考虑根号做法。根号做法有一个阈值\(L\)，然后分讨（钦定\(len_x\lelen_y\)）：\(len_x\lelen_y\leL\)直接暴力做，时间复杂度\(\mathcalO(L)\)。\(L......
李宏毅《机器学习》总结 - RNN & LSTM
在slot-filling问题（如给一个句子，自己分析出时间、地点等）如果只连着不同的FC，那么会导致无法读出是arrive还是leave的情况，导致错误因此，需要NN来考虑到整个句子的信息，也就是需要有memory，这就是RNNRNN原理有了memory，就可以初步解决同一个信息由于句子不同导致的意......
IDEA2022 解决每次启动新项目maven配置就变为C盘问题
1、打开一个空的IDEA如果打开IDEA默认进入之前的项目，可以选择先Closeproject退出项目 2、选择左侧的Customize，再点击Configure 3、在打开的Setting设置里面找到Maven配置Build,Execution,Deployment->BuildTools->Maven 修改后，保存即可； ......

李宏毅《机器学习》总结 - 2022 HW3（图像识别、CNN） Strong Baseline

CNN

相关文章

赞助商

阅读排行