基本概念

各种函数

损失函数（Loss Function）度量单样本****或者一个批次的样本预测的错误程度，损失函数越小，模型就越好。常用的损失函数包括：0-1损失函数、平方损失函数、绝对损失函数、对数损失函数等
代价函数（Cost Function）度量全部样本集的平均误差。常用的代价函数包括均方误差、均方跟误差、平均绝对误差等
目标函数（Object Function）代价函数和正则化函数，最终要优化的函数

特征标准化/数据归一化/标准化

数据归一化和标准化都是常用的数据预处理方法，它们的目的是将不同范围的数据映射到相同的范围内，以便更好地进行模型训练
为什么要标准化？
- 提升模型精度：不同维度之间的特征在数值上有一定比较性，可以大大提高分类器的准确性
- 加速模型收敛：最优解的寻优过程会明显变得平缓，更容易正确的收敛到最优解
- 自己的理解：在特征的量级较大的时候会占到的权重会比较大，对模型的影响也比较大
什么样的数据需要归一化与标准化？
- 需要数据归一化/标准化
  - 线性模型，如基于距离度量的模型包括KNN（K近邻）、K-menas聚类、感知机和SVM。另外，线性回归类的几个模型一般情况下也是需要做数据归一化/标准化处理
- 不需要做数据归一化/标准化
  - 决策树、基于决策树的Boosting和Bagging等集成学习模型对于特征取值大小并不敏感，如随机森林、XGBoost、LightGNM等树模型，以及朴素贝叶斯，以上这些模型不需要坐数据归一化/标准化处理
相关方法
- 归一化（最大-最小规范化）
  
  -
  - 数据归一化的目的是使得各特征对目标变量的影响一致，会将特征数据进行伸缩变化，所以数据归一化时会改变特征数据分布
- Z-Score标准化
  - 数据标准化为了不同特征之间具备可比性，经过标准化变换之后的特征数据分布没有发生改变
  - 就是当数据特征取值范围或单位差异较大时，最好做一下标准化处理

梯度下降

梯度下降的三种形式

批量梯度下降：梯度下降的每一步中，都用到了所有的训练样本
随机梯度下降：梯度下降的每一步中，用到一个样本，在每一次计算之后便更新参数，而不需要首先将所有的训练集求和
小批量梯度下降：梯度下降的每一步中，用到了一定批量的训练样本

正则化

欠拟合的处理

添加新特征
- 当特征不足或者现有特征与样本标签相关性不强时，模型容易出现欠拟合。通过挖掘组合特征等新的特征，往往能够取得更好的效果
增加模型复杂度
- 简单模型的学习能力较差，通过增加模型的复杂度可以使模型拥有更强的拟合能力。例如，在线性模型中添加次高项，在神经网络模型中添加网络层数或神经元个数等
减小正则化系数
- 正则化用来防止过拟合的，但当模型出现欠拟合现象时，则需要针对性地减小正则化系数

过拟合的处理

获得更多的训练数据
- 使用更多的训练数据是解决过拟合问题最有效的手段，因为更多的样本能够让模型学习到更多更有效的特征，减小噪声的影响
降维
- 即丢弃一些不能帮助我们正确预测的特征，可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如PCA）
正则化
- 正则化的技术，保留所有的特征，但是减少参数的大小（magnitude）,它可以改善或者减少过拟合问题
集成学习方法
- 集成学习是把多个模型集成在一起，来降低单一模型的过拟合风险

标签：函数,特征,梯度,模型,拟合,标准化,正则,归一化,基本概念
From： https://www.cnblogs.com/yangzilaing/p/17339645.html

深度学习基础入门篇[六(1)]：模型调优：注意力机制[多头注意力、自注意力]，正则化【L1、L2，D
1.注意力机制在深度学习领域，模型往往需要接收和处理大量的数据，然而在特定的某个时刻，往往只有少部分的某些数据是重要的，这种情况就非常适合Attention机制发光发热。举个例子，图2展示了一个机器翻译的结果，在这个例子中，我们想将”whoareyou”翻译为”你是谁”，传统的模型处理方式是......
正则表达式
正则表达式正则表达式是一组由字母和符号组成的特殊文本，它可以用来从文本中找出满足你想要的格式的句子。一个正则表达式是一种从左到右匹配主体字符串的模式。“Regularexpression”这个词比较拗口，我们常使用缩写的术语“regex”或“regexp”。正则表达式可以从一个基础字符串......
HTTP协议的基本概念
HTTP协议简介HTTP（HyperTextTransferProtocol，超文本传输协议）是一种用于传输超媒体文档（例如HTML）的应用层协议。HTTP协议是一个无状态的协议，意味着服务器并不会记住任何之前的请求和响应。HTTP协议基于客户端-服务器架构模型，客户端发送一个请求到服务器，然后服务器处理请求并发......
day 09 9.1 数据解析之正则
第三章.数据解析之正则RegularExpression，译作正则表达式或正规表示法，表示有规则的表达式，意思是说，描述一段文本排列规则的表达式。正则表达式并不是Python的一部分。而是一套独立于编程语言，用于处理复杂文本信息的强大的高级文本操作工具。正则表达式拥有自己独特的规则语法以......
常用正则表达式
1、日期格式yyyy-MM-dd包括正确性验证^[0-9]{4}-(((0[13578]|(10|12))-(0[1-9]|[1-2][0-9]|3[0-1]))|(02-(0[1-9]|[1-2][0-9]))|((0[469]|11)-(0[1-9]|[1-2][0-9]|30)))$2、日期格式yyyy-MM包括正确性验证^[0-9]{4}-(((0[13578]|(10|12)))|(02-(0[1-9]|[1-2][0-9]))|((0......
JS正则表达式大全
评：原文很多没有全部黏贴过来字符含意\做为转意，即通常在"\"后面的字符不按原来意义解释，如/b/匹配字符"b"，当b前面加了反斜杆后/\b/，转意为匹配一个单词的边界。-或-对正则表达式功能字符的还原，如"*"匹配它前面元字符0次或多次，/a*/将匹配a,aa,aaa，加了"\"后，/a\*/将只匹配"a*"。^匹配一......
RS485基本概念及可靠性设计
项目中几个板子上都用到了485总线，在测试过程中也出现过种种问题，这几天把网上搜集的跟RS485相关的资料整理了一下，总结出关于RS485的一些常见问题，相信把这些问题都理解透彻将会对RS485的基本概念有个全面的掌握。以下大部分资料都是从网络上所得，如果对其说法的正确性有怀疑欢迎讨论 ......
正则表达式
正则表达式的基本知识正则表达式是一种描述字符串结果的语法规则，是一个特定的格式化模式，可以匹配、替换、截取匹配的字符串。常用的语言基本上都有正则表达式，如JavaScript、java等。其实，只有了解一种语言的正则使用，其他语言的正则使用起来，就相对简单些。行定位符（^与$）行定位符是......
vue利用正则去除富文本的标签和样式
constremoveHtmlStyle=(html:any)=>{letrelStyle=/style\s*?=\s*?([‘"])[\s\S]*?\1/g;//去除样式letrelTag=/<.+?>/g;//去除标签letrelClass=/class\s*?=\s*?([‘"])[\s\S]*?\1/g;//清除类名letnewHtml=""; if(html){......
云计算基本概念的介绍，理解的误区有哪些？
或许会以为企业中的基层IT员工和负责人应该很了解云计算的优势和劣势。然而他们对一些基本概念的错误认识实在是令人不安。以下就是非常普遍存在的四大误区。只要使用了公有云，就会有安全风险。这是个很让我感觉不安的误区，我也在博客中多次探讨过这一问题。事实上，在你使用公有云服务......

机器学习的一些基本概念（函数/标准化/梯度下降/正则化）

基本概念

各种函数

特征标准化/数据归一化/标准化

梯度下降

梯度下降的三种形式

正则化

欠拟合的处理

过拟合的处理

相关文章

赞助商

阅读排行