首页 > 其他分享 >线性回归

线性回归

时间:2023-04-27 17:34:39浏览次数:33  
标签:模型 sum min beta 线性 回归

线性回归

线性模型利用特征的线性函数进行预测,这里的线性指的是参数是线性的。

一、普通最小二乘法

线性回归(OLS)是最简单&最经典的线性方法,模型寻找截距和系数,使得模型对训练集的预测值与真实值之间的均方误差(MSE)最小,但是线性回归没有办法控制模型的复杂度(模型有大量的非0参数)。

需要注意,当训练集中的特征(变量)很多的时候,在训练集上,模型越有可能过拟合,导致泛化能力变差(即样本外的预测能力很差)。

$$
y_{i,t} = \alpha_0+
\sum_{i=0}^n\beta_i.X_{i,t}+
\epsilon_{i,t}
\
min(y_{i,t}-\hat y_{i,t})^2
$$

二、岭回归

岭回归也是一种用于回归的线性模型,模型公式和OLS一样,但是目标函数不一样,OLS是最小化均方误差,岭回归是最小化系数平方和的情况下,最小化均方误差。在大量特征的模型中,OLS容易过拟合,这容易导致样本外预测能力的下降,而岭回归可以解决这一问题,将一些变量的系数接近于0(降低复杂度),从而提高泛化能力。这也容易理解,当模型对训练集的数据进行了过高的拟合,对训练集之外的样本,预测能力自然就下降了。

$$
y_{i,t} = \alpha_0+
\sum_{i=0}^n\beta_i.X_{i,t}+
\epsilon_{i,t}
\
min(y_{i,t}-\hat y_{i,t})^2
\
S.t. min(\sum_{i=0}n\beta_i2)
$$

Lasso 回归

除了岭回归之外,还有一种正则化线性回归是Lasso,与岭回归类似,也是约束系数使得系数接近于0,但是与岭回归不同的是,Lasso使用L1正则化,使得一些系数刚好等于0,从而筛选出模型中最重要的的特征。在实践中,Lasso可以给出更加容易理解的模型,因为大部分的变量系数都是0,模型非常简单。

$$
y_{i,t} = \alpha_0+
\sum_{i=0}^n\beta_i.X_{i,t}+
\epsilon_{i,t}
\
min(y_{i,t}-\hat y_{i,t})^2
\
S.t. min(\sum_{i=0}^n|\beta_i|)
$$

标签:模型,sum,min,beta,线性,回归
From: https://www.cnblogs.com/zuocj/p/17359558.html

相关文章

  • 多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析|附代码数据
    原文链接:http://tecdat.cn/?p=22849最近我们被客户要求撰写关于多元时间序列滚动预测的研究报告,包括一些图形和统计输出。当需要为数据选择最合适的预测模型或方法时,预测者通常将可用的样本分成两部分:内样本(又称"训练集")和保留样本(或外样本,或"测试集")。然后,在样本中估计模型,并......
  • 数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附
    原文链接:http://tecdat.cn/?p=24973最近我们被客户要求撰写关于心脏病的研究报告,包括一些图形和统计输出。世界卫生组织估计全世界每年有1200万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病简介心血管疾病的早期预后可以帮助决定改变高危患者的生活方式,从......
  • 机器学习之——回归(regression)、梯度下降(gradient descent)
      本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com。如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任。前言:  上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两......
  • 逻辑结构之一线性表
    1.线性表的定义线性表是具有相同数据类型的n(n>=0)个数据元素的有限序列,其中n为表长,当n=0时是一个空表。若用L命名线性表,则其一般表示为L=(a1,a2,…, ai,ai+1,…,an),式中a1称为表头元素,有且仅有一个直接后继,an称为表尾元素有且仅有一个直接前驱,其他元素有且仅有一个直接后继和一......
  • 立升非线性节点探测器,助力排查不可见的窃密隐患
    非线性结点探测器是一种现代化中非常重要的环境检测装备,用于探测隐藏的半导体结点,主要是P-N结。传统的X射线检查难以发现埋藏在墙体、家具、走道等隐蔽位置的窃听器、针孔摄像头以及疑似爆炸装置中的电子引爆电路。为了应对这些场景的检测需求,相应的无损检测手段非常必要。立升非线......
  • 我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型
    我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型⭕AdamCY888文章目录我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型一、引言二、回归模型简介(一)多元线性回归模型原理(二)建模步骤三、实证分析(一)构建指标及获取数据(二)......
  • 贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
    原文链接:http://tecdat.cn/?p=22702最近我们被客户要求撰写关于贝叶斯分位数回归的研究报告,包括一些图形和统计输出。贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯摘要还包括总结结果、......
  • 数据结构之“线性表(数组)”
    前言:线性表:几个具有相同特性的数据元素的有限序列,线性表在逻辑上是线性结构,也就是连续的一条直线顾名思义“线性表”成一条线的表,在IT领域的数据结构中也有很多能看到的线性表,如“人员花名册”,“网络商品”,“图书名单系统”等等,都是一个个信息紧跟着排好供我们选择浏览等等~但这些......
  • 2-2线性回归实现
    线性回归实现%matplotlibinlineimportrandomfrommxnetimportautograd,np,npxfromd2limportmxnetasd2l生成数据集根据带有噪声的线性模型构造一个人造数据集。任务是使用这个有限样本的数据集来恢复这个模型的参数。##使用线性模型参数w=[2,-3.4]T,b=4.2和噪......
  • 线性SVM决策过程的可视化
    线性SVM决策过程的可视化导入模块fromsklearn.datasetsimportmake_blobsfromsklearn.svmimportSVCimportmatplotlib.pyplotaspltimportnumpyasnp实例化数据集,可视化数据集x,y=make_blobs(n_samples=50,centers=2,random_state=0,cluster_std=0.5)#p......