论文信息

论文标题：Do We Need Zero Training Loss After Achieving Zero Training Error?
论文作者：Takashi Ishida, I. Yamane, Tomoya Sakai, Gang Niu, M. Sugiyama
论文来源：2020 ICML
论文地址：download
论文代码：download
视屏讲解：click

1 简介

　　训练模型的时候，需要将训练损失降到 0 吗？显然不用。一般来说，是用训练集来训练模型，但希望的是验证集的损失越小越好，而正常来说训练集的损失降低到一定值后，验证集的损失就会开始上升，因此没必要把训练集的损失降低到 0。

2 方法

　　假设原来的损失函数是 $\mathcal{L}(\theta)$ ，现在改为 $\tilde{\mathcal{L}}(\theta)$ :

　　　　$\tilde{\mathcal{L}}(\theta)=|\mathcal{L}(\theta)-b|+b$

　　其中 $b$ 是预先设定的阈值。当 $\mathcal{L}(\theta)>b$ 时 $\tilde{\mathcal{L}}(\theta)=\mathcal{L}(\theta)$ ，这时候就是执行普通的梯度下降；而 $\mathcal{L}(\theta)<b$ 时 $\tilde{\mathcal{L}}(\theta)=2 b-\mathcal{L}(\theta)$ ，注意到损失函数变号了，所以这时候是梯度上升。因此，总的来说就是以 $b$ 为阈值，低于阈值时反而希望损失函数变大。论文把这个改动称为 “Flooding”。

　　论文显示，在某些任务中，训练集的损失函数经过这样处理后，验证集的损失能出现“二次下降 (Double Descent) ”，如下图:

3 实验

　　简单来说，就是最终的验证集效果可能更好些，原论文的实验结果如下：

参考

标签：Do,Training,论文,损失,Zero,mathcal,theta
From： https://www.cnblogs.com/BlairGrowing/p/17343286.html

docker的安装（linux、centos）
环境：centos71.先确定linux是否是centos7cat/etc/redhat-release2.如果自己的linux上之前有安装docker,先卸载。如果没有，则直接跳过这一步。执行下面的命令：yumremovedocker\docker-client\docker-client-latest\do......
Docker容器数据卷与DockerFile已经Docker网络原理
5.Docker容器数据卷：5.1什么是Docker的容器数据卷：将应用和环境打包成一个镜像数据？如果数据都在容器中，那么我们容器删除，数据就会丢失！需求：数据可以持久化例如：Mysql,容器删了，如果数据存放在容器当中，那么就是删库跑路了，因此我们希望Mysql的数据可以存储在本地当中！要求：容器之间......
docker harbor安装过程
环境准备安装最新版本docker-ce及docker-composemkdir-p/opt/harbor/certs 下载最新harbor合并有效签发证catpublic.crtchain.crt>www.crtharbor.yml配置文档 [root@repo_nzharbor]#catharbor.yml|grep-v^"#"|grep-v^".#"|grep-v^'#'|g......
Windows安装系统
0x01下载PE微PE0x02安装PE0x021方式一：安装到系统此方法开机有选择系统的选项，强迫症使用方法二0x022方式二：安装到U盘此方法需要一个U盘确认无误后点击立即安装到U盘0x03从U盘进入系统0x031进入bios这步从百度查你的电脑如何进入BIOS，成功后如下图，然后选择USB字样的设备......
LDO工作区网上说明比较混淆，以下为准
LDO一般也工作在饱和区（特殊时会在可变电阻区）pmosId-Uds nmosId-Uds......
odoo doAction
setup(){this.action=useService("action");} openSettings(){console.log("clickaction");//this.action.doAction("base_setup.action_general_configuration");this.action.doAction({......
python-docx高级用法
fromdocximportDocumentfromdocx.enum.sectionimportWD_SECTION#创建一个新文档doc=Document()#添加页眉header=doc.sections[0].headerheader.add_paragraph('Headertext')#添加页脚footer=doc.sections[0].footerfooter.add_paragraph('Footertext')#......
装了.Net 7.0后，工程框架用 net6 的 dotnet watch 出错临时解决方案 Could not load fi
升级vs或者装了.Net7.0后,工程框架用net6的dotnetwatch出错‘Unhandledexception.System.IO.FileNotFoundException:Couldnotloadfileorassembly‘System.Runtime,Version=7.0.0.0’ 临时解决方案:工程目录下建立global.json文件指定编译框架{"......
python-docx常用方法
fromdocximportDocument#创建一个新文档doc=Document()#添加段落para=doc.add_paragraph('HelloWorld!')fromdocx.enum.styleimportWD_STYLE_TYPEfromdocx.enum.textimportWD_ALIGN_PARAGRAPH#添加标题title=doc.add_heading('DocumentTitle',leve......
Mac连接Windows上的mysql服务器
1、关闭Windows的防火墙2、在Windows上新建入站规则，允许访问3306端口一直下一步，完成设置3、在Windows上更新mysql的root用户的host为'%'selecthost,userfromuser;updateusersethost='%'whereuser='root';flushprivileges; 4、在MAC上连接Windows上......

论文解读《Do We Need Zero Training Loss After Achieving Zero Training Error?》

论文信息

1 简介

2 方法

3 实验

相关文章

赞助商

阅读排行