深度学习算法基础

标签：深度正则距离余弦学习算法拟合向量

一，欧氏距离与余弦相似度（cos距离）

专题-机器学习实践
 余弦相似度 | 文本分析：基础

通过对两个文本分词，TF-IDF 算法向量化，利用空间中两个向量的夹角，来判断这两个向量的相似程度：(计算夹角的余弦，取值 0-1)

计算两个向量a、b的夹角余弦：
我们知道，余弦定理：\(cos(\theta) = \frac {a^2+b^2+c^2}{2ab}\) ，由此推得两个向量夹角余弦的计算公式如下：

\[cos(\theta) = \frac {ab}{||a|| \times ||b||} = \frac {x_{1}x_{2}+y_1y_2}{\sqrt{x^2_1+y^2_1}\sqrt{x^2_2+y^2_2}} \]

（分子就是两个向量的内积，分母是两个向量的模长乘积）

在欧几里得空间中，欧式距离其实就是向量空间中两点之间的距离。点 \(x = (x_{1}, ..., x_{n})\) 和 \(y = (y_{1}, ..., y_{n})\) 之间得欧氏距离计算公式如下：

\[d(x,y) = \sqrt {((x_{1}-y_{1})^{2} + (x_{2}-y_{2})^{2} + ... + (x_{n}-y_{n})^{2})} \]

欧式距离和余弦相似度都能度量 2 个向量之间的相似度
放到向量空间中看，欧式距离衡量两点之间的直线距离，而余弦相似度计算的是两个向量之间的夹角
没有归一化时，欧式距离的范围是 [0, +∞]，而余弦相似度的范围是 [-1, 1]；余弦距离是计算相似程度，而欧氏距离计算的是相同程度（对应值的相同程度）
归一化的情况下，可以将空间想象成一个超球面（三维），欧氏距离就是球面上两点的直线距离，而向量余弦值等价于两点的球面距离，本质是一样。

训练误差 train error，泛化误差 generalization error，也叫测试误差(test error)。

正则化是指我们修改学习算法，使其降低泛化误差而非训练误差。正则化是机器学习领域的中心问题之一，只有优化能够与其重要性相媲。
正则化一个学习函数为 \(f(x; θ)\) 的模型，我们可以给代价函数（损失函数）添加被称为正则化项（regularizer）的惩罚。
正则化是一种思想（策略），给代价函数添加惩罚只是其中一种方法。另外一种最常用的正则化技术是权重衰减，通过加入的正则项对参数数值进行衰减，得到更小的权值。当 \(\lambda\) 较大时，会使得一些权重几乎衰减到零，相当于去掉了这一项特征，类似于减少特征维度。

普通参数指算法权重 \(w\) 的值，是可以通过学习算法本身学习得到。超参数的值不是通过学习算法本身学习出来的，可通过验证集人为选择合适的超参数。
将训练数据划分为两个不相交的子集，即训练集和验证集，训练集用于学习普通参数，验证集用于估计训练中或训练后的泛化误差，更新超参数（“训练超参数”）。通常，80% 的训练数据用于训练，20% 用于验证。
交叉验证方法适合小规模数据集（例如几百上千张图片）训练模型的情况。

统计领域的基本概念，例如参数估计、偏差和方差，对于正式地刻画泛化、欠拟合和过拟合都非常有帮助。偏差和方差的关系和机器学习容量、欠拟合和过拟合的概念紧密相联。
偏差和方差度量着估计量的两个不同误差来源。偏差度量着偏离真实函数或参数的误差期望。而方差度量着数据上任意特定采样可能导致的估计期望的偏差。

标签：深度,正则,距离,余弦,学习,算法,拟合,向量
From： https://www.cnblogs.com/armcvai/p/16911805.html