首页 > 其他分享 >深度学习工程基础

深度学习工程基础

时间:2022-11-15 12:34:04浏览次数:58  
标签:训练 工程 模型 深度 学习 正则 拟合 集上 batchsize

欠拟合与过拟合

欠拟合是指模型在训练集、验证集和测试集上均表现不佳的情况
过拟合是指模型在训练集上表现很好,到了验证和测试阶段就大不如意了,即模型的泛化能力很差。

解决方法:

  1. 解决欠拟合的方法:
  • 模型复杂化。
  • 增加更多的特征,使用表达能力更强的输入数据。
  • 调整参数和超参数。常用的 有学习率、学习率衰减等。
  • 增加训练数据。
  • 降低一些正则化约束,因为正则化约束是为了防止过拟合。
  • 降低batchsize,因为过大的batchsize会降低梯度的随机性,使模型陷入局部最优。
    2.解决过拟合的方法:
  • 增加训练集的数据量。
  • 使用正则化约束,常用的有L1,L2正则化。
  • 减少一些specific的特征,增加共性的特征。
  • 降低模型的复杂度,减少神经网络隐藏层的数量。
  • 使用dropout。
  • 提前结束训练。

神经网络的基本思想

用机器模拟人脑神经网络的数学模型,它由多层神经元组成,属于从输入层经过隐藏层到输出层前向传播。
三要素:权重、偏差、激活函数。

标签:训练,工程,模型,深度,学习,正则,拟合,集上,batchsize
From: https://www.cnblogs.com/mumuzeze/p/16892026.html

相关文章

  • 初识Linux(九)------ 学习Shell Scripts
    基本上,shellscript有点像是早期的批处理文件,亦即是将一些指令汇整起来一次执行,但是Shellscript拥有更强大的功能,那就是他可以进行类似程序(program)的编写,并且不......
  • Docker学习笔记六:Docker安装可视化容器管理工具portainer
    一、准备1、介绍Portainer是Docker的图形化管理工具,提供状态显示面板、应用模板快速部署、容器镜像网络数据卷的基本操作;包括上传下载镜像,创建容器等操作、事件日志显......
  • ElasticSearch深度分页详解
    1前言ElasticSearch是一个实时的分布式搜索与分析引擎,常用于大量非结构化数据的存储和快速检索场景,具有很强的扩展性。纵使其有诸多优点,在搜索领域远超关系型数据库,但依......
  • 幻方问题学习
    长话短说,没有啥特别的就是说给出一个数N,然后画出一个N*N的表格,将1-N**2的数字填入,使得每一列和、每一列和、每个对角和都相等。查找资料发现幻方的获得分两种情况,第一个就......
  • 信息学集训 | 01 温故知新,以更好状态学习数据结构和算法
    导读信息学能够有助于孩子未来工作发展,提升孩子的综合能力。这一期课,我们就要正式走进信息学数据结构和算法的世界了!我们将带领大家认识最基础的数据结构和算法,为第四学期深......
  • Flask 学习-97.Flask-SQLAlchemy 排序 order_by()
    前言order_by()对查询结果排序按字段排序根据id字段排序,默认是正序a=Students.query.order_by(Students.id).all()print(a)使用asc()函数正序a=Student......
  • JUC学习笔记——共享模型之无锁
    JUC学习笔记——共享模型之无锁在本系列内容中我们会对JUC做一个系统的学习,本片将会介绍JUC的无锁我们会分为以下几部分进行介绍:无锁操作CAS与Volatile原子类型原理......
  • 深度学习基础课:用全连接层识别手写数字(上)
    大家好~我开设了“深度学习基础班”的线上课程,带领同学从0开始学习全连接和卷积神经网络,进行数学推导,并且实现可以运行的Demo程序线上课程资料:本节课录像回放加QQ群,获得......
  • JAVA学习
    JAVA问题解决综合问题语句FILEf=newFILE("Grades.txt");在IDEA中运行时,读取的目标文件不一定是源码所在目录下的"Grades.txt",而是源码类所属的父模块中最高级的模......
  • 通过计算机基础和帮助的学习,完成学习ifconfig命令的使用。
    1、什么是ifcongififconfig是linux系统的网络配置命令(interfacesconfig),通常是以root身份登入。依赖于ifconfig命令中一些选项属性,ifconfig工具不仅可以被用来简单地获......