首页 > 编程语言 >深度学习算法基础

深度学习算法基础

时间:2022-11-21 16:37:17浏览次数:62  
标签:深度 正则 距离 余弦 学习 算法 拟合 向量

1, 基本概念

一,欧氏距离与余弦相似度(cos距离)

专题-机器学习实践
余弦相似度 | 文本分析:基础

1.1,余弦相似度

通过对两个文本分词,TF-IDF 算法向量化,利用空间中两个向量的夹角,来判断这两个向量的相似程度:(计算夹角的余弦,取值 0-1)

  • 当两个向量夹角越大,距离越远,最大距离就是两个向量夹角 180°;
  • 夹角越小,距离越近,最小距离就是两个向量夹角 0°,完全重合。
  • 夹角越小相似度越高,但由于有可能一个文章的特征向量词特别多导致整个向量维度很高,使得计算的代价太大不适合大数据量的计算。

计算两个向量a、b的夹角余弦:
我们知道,余弦定理:\(cos(\theta) = \frac {a^2+b^2+c^2}{2ab}\) ,由此推得两个向量夹角余弦的计算公式如下:

\[cos(\theta) = \frac {ab}{||a|| \times ||b||} = \frac {x_{1}x_{2}+y_1y_2}{\sqrt{x^2_1+y^2_1}\sqrt{x^2_2+y^2_2}} \]

(分子就是两个向量的内积,分母是两个向量的模长乘积)

1.2,欧式距离

在欧几里得空间中,欧式距离其实就是向量空间中两点之间的距离。点 \(x = (x_{1}, ..., x_{n})\) 和 \(y = (y_{1}, ..., y_{n})\) 之间得欧氏距离计算公式如下:

\[d(x,y) = \sqrt {((x_{1}-y_{1})^{2} + (x_{2}-y_{2})^{2} + ... + (x_{n}-y_{n})^{2})} \]

1.3,余弦相似度和欧氏距离的区别

  • 欧式距离和余弦相似度都能度量 2 个向量之间的相似度
  • 放到向量空间中看,欧式距离衡量两点之间的直线距离,而余弦相似度计算的是两个向量之间的夹角
  • 没有归一化时,欧式距离的范围是 [0, +∞],而余弦相似度的范围是 [-1, 1];余弦距离是计算相似程度,而欧氏距离计算的是相同程度(对应值的相同程度)
  • 归一化的情况下,可以将空间想象成一个超球面(三维),欧氏距离就是球面上两点的直线距离,而向量余弦值等价于两点的球面距离,本质是一样。

2,容量、欠拟合和过拟合

  • 模型容量是指模型拟合各种函数的能力,决定了模型是欠拟合还是过拟合。
  • 欠拟合就是指模型的训练误差过大,即偏差过大,表现为模型不够”准“,优化算法目的在于解决欠拟合问题。
  • 过拟合就是指训练误差和测试误差间距过大,即方差过大,表现为模型不够”稳“,正则化目的在于解决过拟合问题。
  • 机器学习模型的目的是解决欠拟合和过拟合的问题,这也是机器学习算法的两个挑战。

训练误差 train error,泛化误差 generalization error,也叫测试误差(test error)。

3,正则化方法

  • 正则化是指我们修改学习算法,使其降低泛化误差而非训练误差。 正则化是机器学习领域的中心问题之一,只有优化能够与其重要性相媲。
  • 正则化一个学习函数为 \(f(x; θ)\) 的模型,我们可以给代价函数(损失函数)添加被称为正则化项(regularizer)的惩罚。
  • 正则化是一种思想(策略),给代价函数添加惩罚只是其中一种方法。另外一种最常用的正则化技术是权重衰减,通过加入的正则项对参数数值进行衰减,得到更小的权值。当 \(\lambda\) 较大时,会使得一些权重几乎衰减到零,相当于去掉了这一项特征,类似于减少特征维度。

4,超参数和验证集

  • 普通参数指算法权重 \(w\) 的值,是可以通过学习算法本身学习得到。超参数的值不是通过学习算法本身学习出来的,可通过验证集人为选择合适的超参数
  • 将训练数据划分为两个不相交的子集,即训练集和验证集,训练集用于学习普通参数,验证集用于估计训练中或训练后的泛化误差,更新超参数(“训练超参数”)。通常,80% 的训练数据用于训练,20% 用于验证。
  • 交叉验证方法适合小规模数据集(例如几百上千张图片)训练模型的情况。

5,估计、偏差和方差

  • 统计领域的基本概念,例如参数估计、偏差和方差,对于正式地刻画泛化、欠拟合和过拟合都非常有帮助。偏差和方差的关系和机器学习容量、欠拟合和过拟合的概念紧密相联
  • 偏差和方差度量着估计量的两个不同误差来源。偏差度量着偏离真实函数或参数的误差期望。而方差度量着数据上任意特定采样可能导致的估计期望的偏差。

6,随机梯度下降算法

  • 随机梯度下降算法是目前最为广泛应用的一种优化算法,形式为 \(θ=θ − ϵg\),\(ϵ\) 是学习率,\(g\) 是梯度,\(θ\) 是权重。
  • 随机梯度下降优化算法不一定能保证在合理的时间内达到一个局部最小值,但它通常能及时地找到代价函数一个很小的值,并且是有用的。

标签:深度,正则,距离,余弦,学习,算法,拟合,向量
From: https://www.cnblogs.com/armcvai/p/16911805.html

相关文章

  • ENVI新机器学习之异常探测分类工具操作手册
    异常探测是一种用于定位数据集中异常点的数据处理技术。异常值是指与数据集中的已知特征相比被认为不正常的值。例如,如果水是已知的特征,那么除水之外的任何东西都将被视为......
  • LaTeX学习笔记
    由于本人最近正在学习如何用latex学习写实验报告以及其他的pdf文件特此记录一下学习过程以及一些问题如何解决如何插入多个并排图表,并且每个图标单独标号这一问题......
  • Redis学习笔记
    什么是NoSQL相对于传统的关系型数据库(MySQL、Oracle等)的行列模式,在大数据时代很难正常运行,所以产生了NoSQL的一种数据库用来存储访问量比较高的数据,常见的NoSQL数据库有......
  • 心理老师信箱:学习三分钟热度怎么办?
    小云同学来信:老师,我最近很烦,步入初中后,我很想专心学习,可不自觉的就会被分散注意力,学什么都总是三分钟热度,我讨厌这样的状态,一边后悔,一边又控制不住自己,不知道怎么办才好,我......
  • SQL学习_1语法
    SQL指结构化查询语言,全称是StructuredQueryLanguage。SQL语句不区分大小写!SQL命令SELECT–从数据库中提取数据UPDATE–更新数据库中的数据DELETE–从数据......
  • 深入浅出学习透析Nginx服务器的基本原理和配置指南「Https安全控制篇」
    Https反向代理之前的内容中我们主要针对于一些对安全性要求比较高的站点,可能会使用HTTPS(一种使用SSL通信标准的安全HTTP协议),针对于HTTP协议和SSL标准相信大家都知道了,在这......
  • 【算法提高课】动态规划笔记
    单调队列优化DP可以开个结构体存下标和值,不用只存下标,不容易写错;此类问题一般都有烦人的边界问题,需要细心处理;单调队列可以换成优先队列,复杂度会多个\(log\)。推出式......
  • 招聘|大疆招机器学习算法工程师(自动剪辑/激光雷达)
    ​​公司介绍:深圳市大疆创新科技有限公司成立于2006年,如今已发展成为空间智能时代的技术、影像和教育方案引领者。成立十四年间,大疆创新的业务从无人机系统拓展至多元化产......
  • 月薪35K-50K|波波生活算法经理、三维重建算法工程师招聘
    深圳市波波生活信息技术服务有限公司成立于2019年1月,是一家集研发、生产、销售为一体的高科技企业。公司总部设立在深圳,公司主营机器视觉领域的工业应用研发,目前主要进行口......
  • 58同城招聘|三维重建、图像图形学算法工程师(校招/社招)
    3D视觉工坊致力于推荐最棒的工作机会,精准地为其找到最佳求职者,做连接优质企业和优质人才的桥梁。58同城VR项目组招聘公司介绍:58同城是国内领先的生活分类信息网站,海量生活信......