机器学习基础
1 机器学习基本概念
机器学习的本质就是让机器具有一个找函数的能力,通过找函数能力的不同分为回归、分类、结构化学习
1(1)回归
假设要找的函数的输出是一个数值,一个标量,则为回归类问题,如预测类模型就是回归类问题
1(2)分类
分类则是让机器做出选择,人类先准备好一些选项,机器的函数输出就是从这些选项中输出,类似于垃圾分类。
1(3)结构化学习
让机器画一张图或者写一篇文章
2案例学习
机器学习找函数的过程,分为3个步骤
2(1)把函数写成一个方程f
如
$$
y=b+wx_{1}
$$
y为预测值,b为修正值,b、w值未知,$x_{1}$的值为已知,w为权重,b为偏置。
2(2)定义损失
损失也是函数。这个函数的输入是模型里面的参数, 模型是 $y = b + w ∗ x_{1}$,而 b 跟 w 是未知的,损失是函数$ L(b, w)$,其输入是模型参数 b 跟 w。假设未知的参数的设定是 b = 500,w = 1,预测未来的 观看次数的函数就变成$ y = 500 + x_{1}$。假设结果为5300,当真实结果为4900(标签),则差距$e=y_{2}-y_{1}=400$,同是可以求得每一天得误差,计算平均损失L
$$
L=\frac{1}{N \sum_{n}^{} e_{n} }
$$
其中,N 代表训验数据的个数,L 是每一笔训练数据的误差 e 相加以后的结果。L 越大,代表现在这一组参数越不好,L 越 小,代表现在这一组参数越好。估测的值跟实际的值之间的差距,其实有不同的计算方法,计算 y 与 yˆ 之间绝对值的差距,称为平均绝对误差。如果算 y 与 yˆ 之间平方的差距,则称为均方误差。
2(3)解一个最优化的问题
找一个 w 跟 b,把未知的参数找 一个数值出来,看代哪一个数值进去可以让损失 L 的值最小。
方法:梯度下降
先假设只有一个未 知的参数 w,b 是已知的。w 代不同的数值的时候,就会得到不同的损失,这一条曲线就是误差表面。通过算微分进行左右环视,比那个且不断调整。当走到一个点两边都比他大,则这个点为局部最小值,而真正最小的点为全局最小值。
标签:误差,机器,函数,基础,损失,学习,参数 From: https://www.cnblogs.com/bxzl/p/18383759