首页 > 其他分享 >5. Sklearn岭回归

5. Sklearn岭回归

时间:2023-11-05 10:56:44浏览次数:28  
标签:set 回归 plt 拟合 test import clf Sklearn

1. 线性回归

\[w = (X^TX)^{-1}X^TY \]

对于矩阵X,若某些列线性相关性较大(即训练样本中某些属性线性相关 ),就会导致\(X^TX\)的值接近0,在计算\((X^TX)^{-1}\)时就会出现不稳定性。

结论:传统的基于最小二乘的线性回归法缺乏稳定性

2.岭回归

通常情况下会引入正则化(regularization)项解决该问题。
ω加入正则化项则变成

\[w = (X^TX+ \lambda I)^{-1}X^TY \]

由于加上正则化项\(\lambda I\)后,对任意的实数\(X^TX+ \lambda I\)一定为满秩矩阵。

3. 代码

import numpy as np

from sklearn.linear model import Ridge
#通过sklearn.linermodel加载岭回归方法

from sklearn import cross_validation  #加载交叉验证模块,加载matplotilib模块
import matplotlib.pyplot as plt

from sklearn.preprocessing import PolynomialFeatures
#通过sklearn.preprocessing加载PolynomialFeatures用于创建多项式特征,如ab、a2、b2

data=np.genfromtxt('data.txt')  # 使用numpy的方法从txt文件中加载数据
X=data[:,:4]  #X用于保存8-3维数据,即属性
y=data[:,4]  #y用于保存第4维数据,即车流量
poly=PolynomialFeatures(6)#用于创建最高次数6次方的的多项式特征,多次试验后决定采用6次
X=poly.fit_transform(X)  #X为创建的多项式特征

train_set_X, test_set_X , train_set_y, test_set_y =cross_validation.train_test_split(X,y,test_size=0.3.random_state=0)
#将所有数据划分为训练集和测试集,test_size表示测试集的比例
#random_state是随机数种子

clf=Ridge(alpha=1.0,fit intercept = True)  #接下来我们创建岭回归实例
clf.fit(train_set_X,train_set_y) #调用fit函数使用训练集训练回归器
clf.score(test_set_X,test_set_Y)  #利用测试集计算回归曲线的拟合优度,clf.score返回值为0.7375
#拟合优度,用于评价拟合好坏,最大为1,无最小值,当对所有输入都输出同一个值时,拟合优度为0。

#接下来我们画一段200到300范围内的拟合曲线
start=200
end=300
y_pre=clf.predict(x) #是调用predict函数的拟合值
time=np.arange(start,end)
plt.plot(time,y[start:end],'b',label="real")
plt.plot(time,y_pre[start:end],'r', label='predict')展示真实数据( 蓝色 ) 以及拟合的曲线( 红色)
plt.legend(loc= 'upper left') #设置图例的位置
plt.show()

标签:set,回归,plt,拟合,test,import,clf,Sklearn
From: https://www.cnblogs.com/ratillase/p/17810307.html

相关文章

  • 4.Sklearn多项式回归
    1.多项式回归介绍在一元回归分析中,如果依变量y与自变量X的关系为非线性的,但是又找不到适当的函数曲线来拟合,则可以采用一元多项式回归多项式回归的最大优点就是可以通过增加X的高次项对实测点进行逼近,直至满意为止。事实上,多项式回归可以处理相当一类非线性问题,它在回归分析中......
  • 3.Sklearn-一元线性回归
    1.导入包importnumpyasnpimportmatplotlib.pyplotaspltfromsklearnimportlinear_model2.加载训练数据#建立datasets_X和datasets_Y用来存储数据中的房屋尺寸和房屋成交价格。datasets_X=[]datasets_Y=[]fr=open('prices.txt','r')lines=fr.readline......
  • 2.Sklearn库标准数据集及基本功能
    1.sklearn数据集波士顿房价数据集波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋周围的详细信息。其中包括城镇犯罪率、一氧化氮浓度、住宅平均房间数、到中心区域的加权距离以及自住房平均房价等。因此,波士顿房价数据集能够应用到回归问题上。使用sklearn.dataset......
  • HPO-ELM猎食者算法优化极限学习机的数据回归预测 可直接运行 预测效果好 Matlab~
    ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 【lssvm回归预测】基于天鹰算法优化最小二乘支持向量机AO-lssvm实现数据回归预测附mat
    ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 2. 电力负荷预测-一元回归
    1.负荷预测思路电力负荷的时间序列通常可以由三部分组成。\[Y(t)=f(t)+p(t)+X(t)\]\(X(t)\)随机项一般假设为白噪声,即标准正态分布,不改变均值。\(p(t)\)周期项有两种假设方法在数据预处理时进行去周期处理,然后在得到预测结果后,再还原周期。直接带入表示周期项的参数......
  • sklearn-决策树
    目录决策树算法关键特征维度&判别条件决策树算法:选择决策条件纯度的概念信息增益增益率:基尼指数:纯度度量方法1)纯度函数%20%E7%BA%AF%E5%BA%A6%E5%87%BD%E6%95%B0)2)纯度度量函数%20%E7%BA%AF%E5%BA%A6%E5%BA%A6%E9%87%8F%E5%87%BD%E6%95%B0)编辑决策树算法关键了解了“if-else”......
  • Eviews回归分析股权集中度、股权制衡度与公司绩效关系:中小板上市公司数据
    全文链接:http://tecdat.cn/?p=32345原文出处:拓端数据部落公众号本文深入分析了国内外关于股权结构与公司绩效的影响因素;帮助客户运用回归分析法,以ROE作为公司绩效的度量指标,考察中小企业板上市公司股权集中度、股权制衡度对公司绩效的影响因素。为了进行实证研究,选取了部分深......
  • 信也科技推出移动UI自动化平台,持续提升回归测试效率
        在当今竞争激烈的移动应用市场中,用户对APP应用的体验和质量要求越来越高,自动化测试对企业来说至关重要。近日,信也科技研发并推出了移动UI自动化平台,通过将重复的流程进行UI自动化测试,提升回归测试效率,降本增效并为企业长期健康可持续发展打下坚实基础。传统手工回归测试......
  • R语言有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申
    最近我们被客户要求撰写关于有限混合模型聚类FMM的研究报告,包括一些图形和统计输出。摘要有限混合模型是对未观察到的异质性建模或近似一般分布函数的流行方法。它们应用于许多不同的领域,例如天文学、生物学、医学或营销。本文给出了这些模型的概述以及许多应用示例。介绍有限混合......