首页 > 其他分享 >论文解读《Do We Need Zero Training Loss After Achieving Zero Training Error?》

论文解读《Do We Need Zero Training Loss After Achieving Zero Training Error?》

时间:2023-04-22 16:46:57浏览次数:49  
标签:Do Training 论文 损失 Zero mathcal theta

论文信息

论文标题:Do We Need Zero Training Loss After Achieving Zero Training Error?
论文作者:Takashi Ishida, I. Yamane, Tomoya Sakai, Gang Niu, M. Sugiyama
论文来源:2020 ICML
论文地址:download 
论文代码:download
视屏讲解:click

1 简介

  训练模型的时候,需要将训练损失降到 0 吗?显然不用。一般来说,是用训练集来训练模型,但希望的是验证集的损失越小越好,而正常来说训练集的损失降低到一定值后,验证集的损失就会开始上升,因此没必要把训练集的损失降低到 0。

2 方法

  假设原来的损失函数是 $\mathcal{L}(\theta)$ ,现在改为 $\tilde{\mathcal{L}}(\theta)$ :

    $\tilde{\mathcal{L}}(\theta)=|\mathcal{L}(\theta)-b|+b$

  其中 $b$ 是预先设定的阈值。当 $\mathcal{L}(\theta)>b$ 时 $\tilde{\mathcal{L}}(\theta)=\mathcal{L}(\theta)$ ,这时候就是执行普通的梯度下降;而 $\mathcal{L}(\theta)<b$ 时 $\tilde{\mathcal{L}}(\theta)=2 b-\mathcal{L}(\theta)$ ,注意到损失函数变号了,所以这时候是梯度上升。因此,总的来说就 是以 $b$ 为阈值,低于阈值时反而希望损失函数变大。论文把这个改动称为 “Flooding”。

  论文显示,在某些任务中,训练集的损失函数经过这样处理后,验证集的损失 能出现“二次下降 (Double Descent) ”,如下图:

  

3 实验 

  简单来说,就是最终的验证集效果可能更好些,原论文的实验结果如下:

  

参考 

标签:Do,Training,论文,损失,Zero,mathcal,theta
From: https://www.cnblogs.com/BlairGrowing/p/17343286.html

相关文章

  • docker的安装(linux、centos)
    环境:centos71.先确定linux是否是centos7cat/etc/redhat-release2.如果自己的linux上之前有安装docker,先卸载。如果没有,则直接跳过这一步。执行下面的命令:yumremovedocker\docker-client\docker-client-latest\do......
  • Docker容器数据卷与DockerFile已经Docker网络原理
    5.Docker容器数据卷:5.1什么是Docker的容器数据卷:将应用和环境打包成一个镜像数据?如果数据都在容器中,那么我们容器删除,数据就会丢失!需求:数据可以持久化例如:Mysql,容器删了,如果数据存放在容器当中,那么就是删库跑路了,因此我们希望Mysql的数据可以存储在本地当中!要求:容器之间......
  • docker harbor安装过程
    环境准备安装最新版本docker-ce及docker-composemkdir-p/opt/harbor/certs 下载最新harbor合并有效签发证catpublic.crtchain.crt>www.crtharbor.yml配置文档 [root@repo_nzharbor]#catharbor.yml|grep-v^"#"|grep-v^".#"|grep-v^'#'|g......
  • Windows安装系统
    0x01下载PE微PE0x02安装PE0x021方式一:安装到系统此方法开机有选择系统的选项,强迫症使用方法二0x022方式二:安装到U盘此方法需要一个U盘确认无误后点击立即安装到U盘0x03从U盘进入系统0x031进入bios这步从百度查你的电脑如何进入BIOS,成功后如下图,然后选择USB字样的设备......
  • LDO工作区网上说明比较混淆,以下为准
    LDO一般也工作在饱和区(特殊时会在可变电阻区)pmosId-Uds nmosId-Uds......
  • odoo doAction
    setup(){this.action=useService("action");} openSettings(){console.log("clickaction");//this.action.doAction("base_setup.action_general_configuration");this.action.doAction({......
  • python-docx高级用法
    fromdocximportDocumentfromdocx.enum.sectionimportWD_SECTION#创建一个新文档doc=Document()#添加页眉header=doc.sections[0].headerheader.add_paragraph('Headertext')#添加页脚footer=doc.sections[0].footerfooter.add_paragraph('Footertext')#......
  • 装了.Net 7.0后,工程框架用 net6 的 dotnet watch 出错临时解决方案 Could not load fi
    升级vs或者装了.Net7.0后,工程框架用net6的dotnetwatch出错‘Unhandledexception.System.IO.FileNotFoundException:Couldnotloadfileorassembly‘System.Runtime,Version=7.0.0.0’   临时解决方案:工程目录下建立global.json文件指定编译框架{"......
  • python-docx常用方法
    fromdocximportDocument#创建一个新文档doc=Document()#添加段落para=doc.add_paragraph('HelloWorld!')fromdocx.enum.styleimportWD_STYLE_TYPEfromdocx.enum.textimportWD_ALIGN_PARAGRAPH#添加标题title=doc.add_heading('DocumentTitle',leve......
  • Mac连接Windows上的mysql服务器
    1、关闭Windows的防火墙2、在Windows上新建入站规则,允许访问3306端口  一直下一步,完成设置3、在Windows上更新mysql的root用户的host为'%'selecthost,userfromuser;updateusersethost='%'whereuser='root';flushprivileges; 4、在MAC上连接Windows上......