首页 > 其他分享 >AI_Pytorch_损失函数

AI_Pytorch_损失函数

时间:2023-06-29 11:33:29浏览次数:34  
标签:函数 AI 梯度 正则 损失 Pytorch 归一化 向量

数据和向量

 损失函数 

数据的归一化

    Z-score   均值方差归一化(standardization):
        把所有数据归一化到均值为0方差为1的分布中。适用于数据分布没有明显的边界,有可能存在极端的数据值。
		数据符合正态分布,消除离群点的影响
    min-max标准化 最值归一化(Normalization):
     把所有数据映射到0-1之间。适用于分布有明显边界的情况,受 outliner影响较大
       数据符合均匀分布的情况比较适用

向量的归一化

 向量大小和归一化(vector magnitude & normalization)
 范数归一化就是将数据按照范数进行缩放,使得数据的范数等于1。
   数学中,向量(也称为欧几里得向量、几何向量、矢量),指具有大小(magnitude)和方向的量
    向量的长度,即是向量本身的內积开平方
  向量范数(vector norm)
     范数是一种加强了的距离或者长度定义,比距离多一个数乘的运算法则

神经网络标准化与正则化

BN、LN、IN和GN都属于标准化操作
    Batch Normalization
      输入数据独立同分布 每层输入神经元的分布强行拉回到标准正态分布,这样做可以避免梯度消失问题,且可以加快收敛、
    Layer Normalization
      同一层的每个神经元具有相同的均值和方差,而不同的输入样本具有不同的均值和方差
    Group Normalization
    
    Instance Normalization

正则化 Regularization-包括L1、L2(L2 regularization也叫weight decay),dropout
  L1、L2正则化是通过修改代价函数来实现的,
  而Dropout则是通过修改神经网络本身来实现的,它是在训练网络时用的一种技巧(trike)
     L1正则化具备稀疏性。L2正则化可以很好的解决过拟合问题
     原始的代价函数后面加上一个L1正则化项,即所有权重w的绝对值的和,乘以λ/n
     L2正则化就是在代价函数后面再加上一个正则化项:
	 
数据增强
  数据集扩增(data augmentation

损失函数

1.模型:--网络结构和网络参数个数
   回归模型 分类模型
    最小二乘只适合于损失函数相对于回归系数的偏导能直接使用数学变换求出解析解的问题,如线性回归。最小二乘得到解的是全局最优解
	
  网络参数初始化	

2.损失函数(loss function),或“目标函数”、“代价函数”。损失函数的本质是一种描绘拟合效果与真实效果之间差异的函数
    分类损失和回归损失
	MSE就是计算预测值和真实值之间的欧式距离。预测值和真实值越接近,两者的均方差就越小
	交叉熵损失(Cross Entropy)

3.优化方法(optimization)-:在一系列的条件下,寻求最优方案使得目标达到最优的问题统称为优化问题
 优化方法直接作用对象是损失函数
 损失函数可以写成以参数作为自变量的函数形式,这样我们利用数学工具就可以进行参数的最优估计,从而得到一个较为合适的模型
   神经网络(深度学习)常⽤的4种最优化方法——
    SGD、Momentum、AdaGrad、Adam 
	梯度下降法: 梯度法思想的三要素:出发点、下降方向、下降步长。
	  在单变量的函数中,梯度其实就是函数的微分,代表着函数在某个给定点的切线的斜率
        在多变量函数中,梯度是        一个向量,向量有方向,梯度的方向就指出了函数在给定点的上升最快的方向
	    步长设为常数Δ: 所以用λ|W|来代替Δ,而这里的λ就是学习率
	最小二乘是通过对自变量和因变量进行数学变换求导,直接到达最低点,不需要迭代
	
	梯度累积 (Gradient Accumulation), 冻结(Freezing),自动混合精度训练( Automatic Mixed Precision,)
	8位优化器( 8-bit Optimizers)和 Gradient Checkpointing
	
eg:
  Transformer模型中的损失函数通常是交叉熵损失函数,用于衡量模型预测的概率分布与真实标签的概率分布之间的差异
  Transformer模型中,通常使用学习率衰减的方法,即随着训练的进行,逐渐降低学习率	  

强化学习

 强化学习两个最基本的要素就是状态等观测值和奖励函数	
 GAN有generator和discriminator两部分构成

标签:函数,AI,梯度,正则,损失,Pytorch,归一化,向量
From: https://www.cnblogs.com/ytwang/p/17513803.html

相关文章

  • 【AI 充电】揭秘大语言模型实践:分布式推理的工程化落地才是关键!
    分布式推理成为大模型落地的首选方案随着3月15日OpenAI重磅发布了GPT4,其在司法考试、程序编程上的惊艳表现,将大家对大模型的热情推向了顶点,人们纷纷讨论是否我们已经进入到通用人工智能的时代。与此同时,基于大语言模型的应用也如雨后春笋出现在大家面前,其在协同办公、客服......
  • vue列表页返回数组错误Invalid prop: type check failed for prop "data". Expected A
    一个vue列表页接收后端数组时是这样写的:this.list=response.data返回如下错误:Invalidprop:typecheckfailedforprop"data".ExpectedArray,gotObject意思是希望返回一个数组但实际得到一个对象Object,网上大多是初始化userList=[]或userList=null解决的,但......
  • 彻底理解 Node.js 中的回调(Callback)函数
    究竟什么是回调函数(Callback),网上有许许多多的文章,大部分看得人云里雾外,这些文章大概分成两类,第一类堆砌了太多的术语,基本上不明白术语就没法看,另一类反过来,不讲术语,完全是举一些脱离编程的生活化例子来类比,看的人更加晕头转向。作为JS的核心,回调函数和异步执行是紧密相关的,不跨......
  • 离线安装mysql报错解决方法:/usr/sbin/mysqld: error while loading shared libraries:
    Linux:centos7.664位mysql:5.6使用离线方式安装:rpm-ivh--nodepsmysql*,执行systemctlstartmysqld.service发现启动不了,通过vi/var/log/mysql.log看到如下关键字:libraries:libaio.so.1,之前也是按照网上帖子各种修改都没有解决问题,详细报错如下:/usr/sbin/mysqld:error......
  • 逍遥自在学C语言 | 函数初级到高级解析
    前言函数是C语言中的基本构建块之一,它允许我们将代码组织成可重用、模块化的单元。本文将逐步介绍C语言函数的基础概念、参数传递、返回值、递归以及内联函数和匿名函数。一、人物简介第一位闪亮登场,有请今后会一直教我们C语言的老师——自在。第二位上场的是和我们一......
  • synchronized中wait、notify的原理与源码
    synchronized中wait、notify的原理与源码1.wait和notify的流程图2.JVM源码java层面wait的方法publicfinalnativevoidwait(longtimeout)throwsInterruptedException;jvm中object.cstaticJNINativeMethodmethods[]={{"hashCode","()I",......
  • AI绘画StableDiffusion:云端在线版免费使用笔记分享-Kaggle版
    玩AI绘画(SD),自己电脑配置不够?今天给大家介绍一下如何baipiao在线版AI绘画StableDiffusion。Kaggle是世界上最大的数据科学社区,拥有强大的工具和资源,可帮助您实现数据科学目标。(每周可以免费使用30个小时)。文末有更多相关AI资源。 文章较长,可阅读原文享F受更佳阅读体验,以及获......
  • 成为AI提示工程师所需的六项技能
    随着专业的人工智能快速工程工作每年从175,000美元到300,000美元以上,提示工程是一项有吸引力的工作。但是,成为一名优秀的人工智能提示工程师不仅仅需要能够提出引导性问题。您需要结合人工智能、编程、语言、解决问题甚至艺术等学科,才能在这条职业道路上茁壮成长。快速工程从根......
  • inotifywait 监控文件修改实时格式化文件
    我们在学习laravel过程中,从文档网页复制代码,会有一些比较麻烦的问题。以《Laravel10中文文档》|LaravelChina社区(learnku.com)为例 直接点复制按钮会带后,想测试的代码的话,还有处理use语句选中复制时,网站会向剪贴板追加来源信息,还得手动处理。 这些手动处理......
  • 欧拉函数证明与代码实现
    欧拉函数定义对于正整数n小于等于n的数中与n互质的数的个数记为\(\varphi(n)\),即为欧拉函数欧拉公式由算数基本定理任意一个正整数都可以写作n=\(p_1^{a_1}p_2^{a_2}\cdotsp_k^{a^k}\)那么\(\varphi(n)=n\prod\limits_{i=1}^{k}({1-\frac{1}{p_i}})\)数学证明首先\(\var......