模型参数选择

模型参数选择

时间：2022-09-30 15:12:44浏览次数：85

标签：... 模型元素张量选择优点参数 size

抑制过拟合：四个方法

1.添加正则项

L1正则项（作为特征选择器，模型稀疏）

尽可能是余项（w相关项）为0 ，（说明细胞是死掉的，模型就变得稀疏，这个细胞就没用，在模型进行压缩的时候可以砍掉就可以很大倍数的压缩）， w为0的时候这个细胞是没有意义的。入自己定义的，J(w)是loss

L2正则项（连续可导，易于训练）

2.Dropout

$$
X \sim b(n, p)
$$

以2算式丢弃神经网络的节点。 p是丢弃的概率，优点使模型变得简单，抑制过拟合

3.Data Augmentation：数据增广

在数据上做文章，增广后的数据尽可能服从原数据的分布

Snipaste_2022-09-30_10-25-44

4.Early Stopping ：早停

Snipaste_2022-09-30_11-47-21

Snipaste_2022-09-30_11-50-02

Snipaste_2022-09-30_11-55-10

选择激活函数

torch.randn()参数size与输出张量形状

当size是n个数时，m_1， m_2，...，m_n，若n为奇数，则返回一个m_1行1列的张量，其中每个元素是一个m_2行m_3列的张量，....，又其中每个元素是一个m_n- 1行m_n列的张量，最小元素的每一行服从正态分布。
当size是n个数时，m_1，m_2，...，m_n，若n为偶数，则返回一个m_1行m_2列的张量，其中每个元素是一个m_3行m_4列的张量，...，又其中每个元素是一个m_n-1行m_n列的张量，最小元素的每一行服从正态分布。

Snipaste_2022-09-30_14-30-44

存在的问题：容易陷入局部最优解。

阿尔法太小的话训练时间太长成本太大，阿尔法太大容易忽略最优解（跨过最后解）

更改：

Snipaste_2022-09-30_14-41-07

随机梯度下降系列 SGD：动量上做文章单向的时候vt越来越大，当从优点左面震荡到最优点右面的时候，速度就会减慢，直到找到最优点。

自适应学习率系列 Ada：学习率上做文章 每个 seita 单独跟踪。越从快到慢寻找最优点。

目标是：加快收敛，抑制震荡

优化器的选择：

如果数据是稀疏的，就用学习率自适应优化器

标签：...,模型,元素,张量,选择,优点,参数,size
From： https://www.cnblogs.com/aohongchang/p/16744958.html

Mastercam如何使用”素材模型”来做残料分析
使用素材模型的定义，来做模型与残料的比较。(对于着色的误差显示残料有多少，您可自行定义残料的色差范围。)1、建立素材模型素材定义>建立名称>建立素材(点选所有实体或......
echars 各个参数
echarts通用配置通用配置：指的是任何一种类型的图表都可以使用的配置。1.通用配置title（1）文字样式：textStyle（2）标题边框：borderWidth、borderColor、borderRadius（3）标题位置......
网速快慢与网线材质的选择关系
网速慢？网线选对了吗？家用网线不必选最贵的！上网慢、视频卡、游戏掉线，究竟是路由器的锅，还是宽带不给力？其实，你可能是网线没选对！网线是连接设备的桥梁，网线选不好，网速就慢。比如路......
现代功率谱估计（2）：Levinson-Durbin递推方法求解AR模型参数
现代功率谱估计（2）：Levinson-Durbin递推方法求解AR模型参数p阶AR模型的差分方程形式和系统函数分别为：令$z=e^{jw}$，则AR模型输出的功率谱密度为：AR模型的系统输出信号......
现代功率谱估计（3）：SVD-TLS，奇异值分解—总体最小二乘方法求解AR模型参数
现代功率谱估计（3）：SVD-TLS，奇异值分解—总体最小二乘方法求解AR模型参数Yuler-Walker方程及修正Yuler-Walker方程对于一个AR$(p)$过程，其输出信号的自相关函数和AR系数有以......
车刀刀杆的选择
一、刀杆选择1、外圆刀杆选择图2、内孔刀杆选择图二、刀杆选择方法及考虑因素考虑因素●零件结构和限制：零件的复杂性。直径大小，振动趋势，表面质量●加工工序：外圆，内孔，端面，切槽......
怎么选择软件开发工具？零代码创造工具有什么优势？
借我借我一双亮眼吧，让我把这些平台彻底看个清清楚楚明明白白！如果低代码平台只是基于定制好的模块来完成模块的拼接或者调用预定义好的存储过程，看上去很美好，实质是一个大坑，......
立铣刀的选择
近几年加工中心主轴的高速化技术的发展，为了因应高强度高硬度材料进行高速加工，且为求能延长模具寿命，所以其使用的被削材料硬度提升，为配合有更好加工效率效益，对其加工使用刀具......
这么多低代码开发厂商，怎么选择？
看你用来做什么，如果只是要求简单，也没必要太费神，而如果要用到复杂的应用，甚至ERP之类的，也在低代码平台做的，那能做这种定制的要求比较高，所以这种平台少且必须是原子级定制的。......
服务器租用怎么选择硬件配置
1、根据规模测试压力像服务器这样的物品一般都是一次性的确定好成本，所以企业在选择的时候一定要多想一下。需要做与制造厂商多次协商与谈判，在确定购买的时候也要测试......