tunning book 学习笔记

时间：2023-01-24 14:45:13浏览次数：50

标签：tunning 25 批量 batch 笔记正则 book norm 调整

1. 所选优化器的所有超参数
2. 批量大小（batch size)
- batch norm vs LayerNorm

github网站：https://github.com/google-research/tuning_playbook

调参时需要考虑的内容：

1. 所选优化器的所有超参数

SGD/ADAM/NAdam
怎么调Adam？

按照研究中试验次数的不同“预算”来调整：
如果一项研究中有 < 10 次试验，则只调整（基础）学习率。
如果 10-25 次试验，调整学习率和\(\beta_1\)。
如果超过 25 次试验，调整学习率，\(\beta_1\)和\(\epsilon\)。
如果可以运行超过 25 次试验，另外调整 \(\beta_2\)。

2. 批量大小（batch size)

不应该调整批量大小来直接提高验证集性能
由于样本方差，较小的批次大小会在训练算法中引入更多噪声，并且这种噪声可能具有正则化效果。因此，较大的批量可能更容易过度拟合，并且可能需要更强的正则化和/或额外的正则化技术。
更改批量大小时可能需要调整训练步数
只要所有超参数都经过良好调整（尤其是学习率和正则化超参数）并且训练步数足够，使用任何批量大小都应该可以获得相同的最终性能

batch norm vs LayerNorm

batch norm 通常可以用 LayerNorm 代替，但在不能代替的情况下，更改batch size大小或主机数量时会出现一些棘手的细节。

标签：tunning,25,批量,batch,笔记,正则,book,norm,调整
From： https://www.cnblogs.com/slowlai/p/17066056.html

python入门学习笔记002--趣学Python算法--第2例兔子产子
例题如下：有一对兔子，从出生后的第3个月起每个月都生一对兔子。小兔子长到第3个月后每个月又生一对兔子，假设所有的兔子都不死，问30个月内每个月的兔子总对数为多少？个......
Splay 学习笔记
二叉查找树一定是一颗二叉树左子树任意节点的值\(<\)当前节点的值\(<\)右子树任意节点的值基本思想Splay的基本思想就是越经常访问的节点的深度就越低，也就是说，......
2017 hypernetworks 笔记
HYPERNETWORKS这篇文章来自谷歌的一篇文章Introduction这篇文章中提出了一种方法：使用一个小网络（hypernetwork），小网络的作用是给一个largernetwork（mainnetwork）来生成权重，这......
python入门学习笔记001--趣学Python算法--第一例抓交通肇事犯
本人是python小白初学者，过年期间实在闲的无聊，偶尔翻到《趣学Python算法100例》这本书，浅浅阅读后感觉写的很不错。本系列案例均取自该书，只分享题目和自己的编的代码，问题分析......
ABB 800XA学习笔记67：硬件组态1
这一篇学习笔记我在新浪博客记录过，地址是ABB800XA学习笔记67：硬件组态1_来自金沙江的小鱼_新浪博客(sina.com.cn)在这里我再记录一遍，以免丢失现在进入第六章的学习，总共26......
学习笔记——CentOS中的时间日期类命令；用户管理类命令（useradd，passwd ，id，su ，userdel，who
2023-01-24一、CentOS中的时间日期类命令1、date显示当前时间（1）date （功能描述：显示当前时间）（2）date+%Y（功能描述：显示当前年份）（3）date+%m（功能描述：显示当前月份）（4）date......
学习笔记——CentOS中的帮助命令；常用快捷键；文件目录类命令
2023-01-24一、帮助命令1、基本语法man[命令或配置文件] 功能描述：获得帮助信息2、显示说明（1）NAME：命令的名称和单行描述（2）SYNOPSIS：怎样使用命令（3）DESCRIPTION：命令功能......
ABB 800XA学习笔记66：项目框架结构17
这篇学习笔记我在新浪博客记录过，地址是ABB800XA学习笔记66：项目框架结构17_来自金沙江的小鱼_新浪博客(sina.com.cn)5.7测试（模拟）模式可以不使用任何物理硬件模拟一个项......
ABB 800XA学习笔记63：项目框架结构64：https://blog.sina.com.cn/s/blog_724246b90102zji
这一篇学习笔记我在新浪博客记录过，地址是ABB800XA学习笔记63：项目框架结构14_来自金沙江的小鱼_新浪博客(sina.com.cn)在这里我爱记录一遍，以免丢失5.6.3声明窗格使用申......
ABB 800XA学习笔记64：项目框架结构15
这一篇学习笔记我在新浪博客记录过，地址是ABB800XA学习笔记64：项目框架结构15_来自金沙江的小鱼_新浪博客(sina.com.cn)在这里我也记录一遍，以免丢失5.6.4消息窗格消息窗......

tunning book 学习笔记

1. 所选优化器的所有超参数

2. 批量大小（batch size)

batch norm vs LayerNorm

相关文章

赞助商

阅读排行