首页 > 其他分享 >机器学习——线性回归

机器学习——线性回归

时间:2023-05-04 21:32:57浏览次数:25  
标签:机器 导数 梯度 回归 矩阵 多元 线性


文章目录

  • 1.代价函数(cost function)
  • 1.1 代价函数图像
  • 2.gradient descent(梯度下降)
  • 2.1 正导数:positive derivative
  • 2.2 负导数:negative derivatvie
  • 2.3 线性回归的梯度下降(gradient descent of linear regression )
  • 3.矩阵的介绍
  • 4.多元线性回归和其梯度下降
  • 4.1 多元线性回归
  • 4.2 多元线性回归的梯度下降
  • 4.3 多元线性回归的梯度下降——特征缩放
  • 4.4 多项式回归

1.代价函数(cost function)

1.1 代价函数图像

机器学习——线性回归_梯度下降


上图两个坐标表示参数机器学习——线性回归_梯度下降_02机器学习——线性回归_机器学习_03,它们是动态变化的。通常使用contour figure(等高线线)来描述上面的3D图像:

机器学习——线性回归_逻辑回归_04

在右图的等高线中,每个圆圈上面的点的值是一致的。当前红色点处于参数机器学习——线性回归_逻辑回归_05对应于左图的直线,但这时候的直线没有很好拟合数据。

2.gradient descent(梯度下降)

  • 微积分:calculus
  • 导数:derivatives
  • 收敛:converge
  • 不收敛:diverge

梯度下降更新公式:
机器学习——线性回归_机器学习_06

上面两个参数需要同步更新,也就是说在一次迭代中,这两个参数是同时更新的。假设首先需要更新参数机器学习——线性回归_机器学习_03,其cost function为:
机器学习——线性回归_梯度下降_08

同时其cost function的函数图像为:

2.1 正导数:positive derivative

机器学习——线性回归_梯度下降_09

当利用公式(2-1)可以求得导数为positive number,则机器学习——线性回归_机器学习_03会偏向于向最小值移动。

2.2 负导数:negative derivatvie

机器学习——线性回归_人工智能_11

同样的,求得的导数会出现negative number,则使得更新之后的机器学习——线性回归_机器学习_03也会偏向于最小值。

2.3 线性回归的梯度下降(gradient descent of linear regression )

在线性回归中,通常使用square error(平方误差)来计算代价函数:
机器学习——线性回归_机器学习_13

机器学习——线性回归_逻辑回归_14
公式中机器学习——线性回归_逻辑回归_15代表真实样本的值,机器学习——线性回归_逻辑回归_16则代表线性回归模型的预测值。机器学习——线性回归_梯度下降_17为data set中的样本数。

  • 为什么要在分子上加上2呢这是因为在求解partial derivative(偏导数)中可以化简出比较简便的形式。

最后可以分别求得两个参数的partial derivative:
机器学习——线性回归_机器学习_18

机器学习——线性回归_逻辑回归_19

  • Batch:每完成一次梯度更新,则默认为完成了一个batch。在batch里面,梯度更新会计算所有的机器学习——线性回归_逻辑回归_20个样本。

3.矩阵的介绍

  • 单位(identity)矩阵:机器学习——线性回归_机器学习_21(对角矩阵都为1)
  • 转置矩阵
  • 矩阵的逆(matrix inverse):
    机器学习——线性回归_人工智能_22
    其中矩阵机器学习——线性回归_吴恩达_23的维度为机器学习——线性回归_逻辑回归_24,它必定是一个方阵。如果一个矩阵没有逆矩阵,则称为奇异矩阵(Singular matrix),元素为0的矩阵就是一个奇异矩阵。

4.多元线性回归和其梯度下降

4.1 多元线性回归

之间已经简要叙述过简单的线性回归模型,其公式为:
机器学习——线性回归_机器学习_13

为了引出多元线性回归模型,引入一个预测房价的问题,其具体的特征如下:

机器学习——线性回归_吴恩达_26


在上面的房价预测问题中,共有4个特征:size,房间数量,楼层,使用年限,需要预测的是:价格

  • 机器学习——线性回归_机器学习_27:共有n个特征
  • 机器学习——线性回归_吴恩达_28:表示在数据集中的第机器学习——线性回归_逻辑回归_29个样本
  • 机器学习——线性回归_逻辑回归_30:表示在第机器学习——线性回归_逻辑回归_29个样本中,第机器学习——线性回归_吴恩达_32个特征。

最后可以列出多元线性回归模型:
机器学习——线性回归_逻辑回归_33
其中,机器学习——线性回归_吴恩达_34机器学习——线性回归_梯度下降_35都为一维向量,同时机器学习——线性回归_逻辑回归_36

4.2 多元线性回归的梯度下降

在2.3节中已经简单介绍了线性回归的梯度下降,那么多元线性回归的梯度下降也是一样的,在一次迭代的过程当中,需要更新所有的参数机器学习——线性回归_吴恩达_34
机器学习——线性回归_机器学习_38

具体的,上述公式中的偏导数可以化简为:
机器学习——线性回归_吴恩达_39

4.3 多元线性回归的梯度下降——特征缩放

在原始的算法当中,不同特征之间的取值范围不同,会造成gradient descent时收敛过慢。例如,假设存在两个特征:房子的面积和房子的年龄。房子面积机器学习——线性回归_人工智能_40的取值范围在**(1-2000),而房子年龄机器学习——线性回归_机器学习_41的取值范围为(1-10)**。这两个特征对应的参数为:机器学习——线性回归_吴恩达_42。它们的代价函数contour图像如下:

机器学习——线性回归_吴恩达_43


可以看出机器学习——线性回归_机器学习_03的取值范围会比机器学习——线性回归_吴恩达_45要小,这是因为只要改变一点点的机器学习——线性回归_机器学习_03,则代价函数机器学习——线性回归_梯度下降_47会影响比较大,所以它的取值会比较小。这时候如果利用梯度下降算法,它会收敛速度比较慢。而如果把这两个特征进行缩放,缩放到0-1之间,这时候图像会变成:

机器学习——线性回归_人工智能_48


此时收敛速度加快,能够更快找到全局最优点。缩放特征有两种比较常见的方法:

  • 最大最小归一化
    机器学习——线性回归_逻辑回归_49
    首先找出该特征所有值的最大值和最小值,然后按照公式对每个特征值进行缩放。
  • Z-score标准化
    机器学习——线性回归_人工智能_50
    其中机器学习——线性回归_梯度下降_51为均值,机器学习——线性回归_人工智能_52为方差

4.4 多项式回归

有些数据不能简单用多元线性回归来进行拟合,这时候可以利用多项式回归来进行拟合。

具体的,polynomial regression可以拟合下图:

机器学习——线性回归_机器学习_53


可以用下面公式表示

机器学习——线性回归_逻辑回归_54

也即是说可以用cubic model(三次模型)来拟合曲线,同时作为多项式回归方程。


标签:机器,导数,梯度,回归,矩阵,多元,线性
From: https://blog.51cto.com/u_12243550/6244547

相关文章

  • 2023/05/03(矩阵+高斯+线性基)
    (点击黑色题号进入题目~~)1.矩阵$\color{#000000}{P4723}$$\color{#555555}{多项式}$->$\color{#000000}{P1939}$$\color{#FFB90F}{矩阵加速}$$\color{#000000}{CF575A}$$\color{#B23AEE}{Fibonotci}$$\color{#000000}{P2579}$$\color{#6495ED}{......
  • 机器学习中的batch_size
    batch_size:表示单次传递给程序用以训练的数据(样本)个数。比如我们的训练集有1000个数据。这是如果我们设置batch_size=100,那么程序首先会用数据集中的前100个参数,即第1-100个数据来训练模型。当训练完成后更新权重,再使用第101-200的个数据训练,直至第十次使用完训练集中的1000个数据......
  • Unity之伽马空间与线性空间
    关于伽马空间与线性空间,可参考:https://zhuanlan.zhihu.com/p/432224776https://blog.csdn.net/sinat_34014668/article/details/128604170https://blog.csdn.net/zhjzhjxzhl/article/details/119917984https://zhuanlan.zhihu.com/p/432846112总结如下:1)PS输出的是sRGB贴图(G......
  • 线性基学习笔记
    概念线性基是一个集合。从原集合中选取任意数都能通过线性基中的数异或得到。本质上是对集合的压缩性质所有数字没有最高位相同的集合大小为\(\log_2\)级别。操作排查:若线性基内有最高位相等的,让其相异或,并继续排查直到没有可操作的数。若原集合内有\(0\)线......
  • 突破性的机器鱼有一种扭曲的推进方式
     该机器人由一个浮动部分(蓝色)和一个独特的推进系统(红色)组成        詹龙佑在设计类似鱼的水下机器人时,您需要一种既节能又速度适中的推进方式。一种新的尾巴拍打系统可能符合要求,为此类机器人的更广泛使用铺平了道路。 布里斯托大学的一组科学家在博士生Tsa......
  • [Leetcode] 0657. 机器人能否返回原点
    657.机器人能否返回原点题目描述在二维平面上,有一个机器人从原点(0,0)开始。给出它的移动顺序,判断这个机器人在完成移动后是否在 (0,0)处结束。移动顺序由字符串 moves 表示。字符move[i]表示其第i次移动。机器人的有效动作有 R(右),L(左),U(上)和D(下)。如果机器人在完......
  • python-Gradio 机器学习演示库
    python-GradioGradio是一个开源的Python库,用于构建机器学习和数据科学演示应用。有了Gradio,你可以围绕你的机器学习模型或数据科学工作流程快速创建一个简单漂亮的用户界面。Gradio适用于以下情况:为客户/合作者/用户/学生演示你的机器学习模型。通过自动共享链接快速部署你的......
  • 基于麻雀算法优化的相关向量机RVM回归预测算法
    基于麻雀算法优化的相关向量机RVM回归预测算法文章目录基于麻雀算法优化的相关向量机RVM回归预测算法1.RVM原理2.基于麻雀算法优化的相关向量机RVM3.算法实验与结果3.参考文献:4.MATLAB代码摘要:本文主要介绍相关向量机RVM的基本原理,以及在预测问题中的应用。1.RVM原理RVM算法是......
  • 径向基RBF神经网络的电力负荷数据回归预测matlab 程序代码,数据EXCEL格式,直接运行。
    径向基RBF神经网络的电力负荷数据回归预测matlab程序代码,数据EXCEL格式,直接运行。可更换自己数据,上手简单。ID:7426632657061937......
  • 线性二自由度模型,对比carsim模型,运动学模型
    线性二自由度模型,对比carsim模型,运动学模型ID:3213626331813781......