首页 > 其他分享 >label smoothing理论推导

label smoothing理论推导

时间:2022-12-02 17:06:50浏览次数:33  
标签:logit 推导 错误类别 label softmax 求导 smoothing


我们知道,softmax容易使模型过度自信过拟合,label smoothing作为一种改善方案可以提高模型的泛化能力。

label_smoothing

上篇博客推导过反向求导的结果如下​​softmax求导/label_smoothing求导/知识蒸馏求导​label smoothing理论推导_git
其中
label smoothing理论推导_git_02
求导结果与上面softmax相同
label smoothing理论推导_机器学习_03
令导数等于0,将label smoothing理论推导_算法_04代入
label smoothing理论推导_git_05
假定错误类别的概率相等,化简上式得:
label smoothing理论推导_git_06
label smoothing理论推导_算法_07时记为label smoothing理论推导_机器学习_08得:
label smoothing理论推导_错误类别_09
所以,使用label smoothing编码,损失函数为交叉熵的话,错误类别的logit不会要求是负无穷,当正确类别和错误类别的logit有一定误差,接近label smoothing理论推导_算法_10的情况下,loss就会很小趋于0。
简单的label smoothing为什么能够涨点呢


标签:logit,推导,错误类别,label,softmax,求导,smoothing
From: https://blog.51cto.com/u_15899958/5907217

相关文章

  • Python基础之推导式
    ⼀、列表推导式作⽤:⽤⼀个表达式创建⼀个有规律的列表或控制⼀个有规律列表。列表推导式⼜叫列表⽣成式。1、示例创建⼀个0-10的列表1、while循环实现#1.准备⼀个空列表li......
  • 双目视觉测距原理,数学推导及三维重建资源
    先说一下单/双目的测距原理区别:单目测距原理:先通过图像匹配进行目标识别(各种车型、行人、物体等),再通过目标在图像中的大小去估算目标距离。这就要求在估算距离之前首先对目......
  • labelme安装
    1.参考labelme的github代码进行安装https://github.com/wkentaro/labelmecondacreate--name=labelmepython=3.9sourceactivatelabelmecondainstallpyqtconda......
  • 011relabel_configs详解
    写在之前prometheus配置文件大体框架有以下几个部分:data:  prometheus.yml:|#    rule_files:    -etc/prometheus/rules.yml    alerting:     ......
  • 010Prometheus配置文件中metric_relabel_configs详解
    Prometheus从数据源拉取数据后,会对原始数据进行编辑其中 ​​metric_relabel_configs​​​是Prometheus在保存数据前的最后一步标签重新编辑(relabel_configs)。所以,哪......
  • namespace、pod、label、deployment文档
    namespace、pod、label、deployment文档一、NamespaceNamespace是kubernetes系统中的一种非常重要资源,它的主要作用是用来实现多套环境的资源隔离或者多租户的资源隔离......
  • label studio 结合 MMDetection 实现数据集自动标记、模型迭代训练的闭环
    前言一个AI方向的朋友因为标数据集发了篇SCI论文,看着他标了两个多月的数据集这么辛苦,就想着人工智能都能站在围棋巅峰了,难道不能动动小手为自己标数据吗?查了一下还真......
  • 解决Django的【LookupError: No installed app with label ‘admin‘】
    其实这个问题比较好解决:1、首先debugmain函数,定位你的问题,我这边的问题是报这个错误;'ErrorloadingMySQLdbmodule.\n''Didyouinstallmysqlclient?'  2、针对......
  • [拓扑排序 反向建图] 825E - Minimal Labels
    [拓扑排序编号字典序最小]825E-MinimalLabels题目​​题目链接​​思路这题答案要求节点编号越小,打上的标签越小,即编号序列字典序最小,而非拓扑序列字典序最小。想让当......
  • Prometheus AlertManager 生产实践-直接根据 to_email label 发 alert 到对应邮箱
    ##概述通过之前的文章-[PrometheusAlertmanager生产配置趟过的坑总结](​​https://ewhisper.cn/posts/31626/​​),我们已经知道AlertManager作为告警平台,是非常强......