首页 > 其他分享 >12/27每日总结

12/27每日总结

时间:2023-12-27 21:33:16浏览次数:29  
标签:总结 12 函数 分类 batch 正则 27 softmax 最小化

动手学深度学习拾遗

学习完一遍后,通过基于(波士顿房价预测,叶子分类)实战将已经快遗忘的知识点进行拾遗复习

softmax

首先是softmax分类头的问题,softmax作为分类问题中常见的分类方法,在pytorch中并未直接实现,而是附加到了交叉熵损失函数中,所以在使用时直接进行使用就可以了

正则化

缓解过拟合问题,一是我们可以采集更多的优质数据来缓解,在数据已经尽可能多且优质时,就要将重心放在正则化上

限制特征数量是缓解过拟合的一种常见技术,但是简单丢弃特征这一工作过于生硬,我们模型复杂度的增加需要一个更细粒度的工具

最常用的方法是将范数作为惩罚项加入到损失函数的最小化中一同最小化,当权重函数增长过大时就会更集中于最小化权重函数

在简洁实现中只需要将optim的weight_decay参数指定出来就可以实现

batch_normal

batchnorm能够解决梯度消失问题,将每个batch的数据拿出来做一次正则化,减少内部的协变量偏移(一种直觉,并非严谨协变量偏移)

标签:总结,12,函数,分类,batch,正则,27,softmax,最小化
From: https://blog.51cto.com/u_16196891/9004006

相关文章

  • 12.12
    为什么说Java语言“编译与解释并存”?高级编程语言按照程序的执行方式分为编译型和解释型两种。编译型语言是指编译器针对特定的操作系统将源代码一次性翻译成可被该平台执行的机器码。解释型语言是指解释器将源代码逐行解释成特定平台的机器码并立即执行。Java语言既具有......
  • 12.11
    什么是字节码?采用字节码的好处是什么?所谓的字节码,就是Java程序经过编译之后产生的.class文件,字节码能够被虚拟机识别,从而实现Java程序的跨平台性。Java程序从源代码到运行主要有三步:编译:将源代码(.java)编译成虚拟机可以识别理解的字节码文件(.class);解释:虚拟机执行字节码文......
  • 11.27
    静态内部类(static修饰类的话只能修饰内部类):静态内部类与非静态内部类之间存在一个最大的区别:非静态内部类在编译完成之后会隐含地保存着一个引用,该引用是指向创建它的外围类,但是静态内部类却没有。没有这个引用就意味着:1.它的创建是不需要依赖外围类的创建。2.它不能使用任......
  • 12.1
    Java只支持单继承,不支持多继承。一个类只能有一个父类,不可以有多个父类。Java支持多层继承(继承体系)。Java继承了父类非私有的成员变量和成员方法,但是请注意:子类是无法继承父类的构造方法的。注意:不要仅为了获取其他类中某个功能而去继承,类与类之间要有所属(“isa”)关系方......
  • 12.4
    抽象类抽象类的概念:Java中可以定义没有方法体的方法,该方法的具体实现由子类完成,该方法称为抽象方法,包含抽象方法的类就是抽象类。如:Shape类计算周长和面积的方法无法确定,那么就可以将这样的方法声明为抽象的,以便在具体的子类中进行实现。抽象类的声明:[修饰符]abstractclass类......
  • 12.6
    面向对象(封装,继承,多态);编译与解释并存;平台无关性,平台无关性的具体表现在于,Java是“一次编写,到处运行”的语言,因此采用Java语言编写的程序具有很好的可移植性,而保证这一点的正是Java的虚拟机机制。在引入虚拟机之后,Java语言在不同的平台上运行不需要重新编译。支持多线程。C++......
  • 闲话12.27
    今天很颓废啊。上午劲爆写题啊,猜数游戏这题寒假的时候讲过......
  • 12.27闲话
    我去怎么明天就考试了今天没啥抽象事,就是分块入门9题我T1都没写过去非常恼带修莫队没写出来,要是线段树就直接乱杀了,分块估计也能乱杀我非常恼TLE的带修莫队#include<bits/stdc++.h>#defineintlonglong/*---------------fastio---------------*/usingnamespacest......
  • 12.5
    接口在Java中接口不仅仅是程序开发过程中“约定”,更是更加抽象化的抽象类。接口的声明语法: [修饰符]interface接口名{[常量];[抽象方法];}接口实现的语法: [修饰符]class类名[extends父类名][implements接口1,接口2,……]{类体部分}一个类可以实现多个接口,从而解决了......
  • 12.7
    JVM:JavaVirtualMachine,Java虚拟机,Java程序运行在Java虚拟机上。针对不同系统(Windows,Linux,macOS)的实现不同的JVM,因此Java语言可以实现跨平台。JRE:JavaRuntimeEnviroment,Java运行时环境。是运行基于Java语言编写的程序所不可缺少的运行环境,用于解释执行Java的字节码文件。......