首页 > 其他分享 >R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

R语言lasso惩罚稀疏加法(相加)模型SPAM拟合非线性数据和可视化

时间:2023-08-21 22:14:42浏览次数:48  
标签:非线性 SPAM 模型 拟合 可视化 加法 数据 lasso

全文链接:https://tecdat.cn/?p=33462

原文出处:拓端数据部落公众号

本文将关注R语言中的LASSO(Least Absolute Shrinkage and Selection Operator)惩罚稀疏加法模型(Sparse Additive Model,简称SPAM)。SPAM是一种用于拟合非线性数据的强大工具,它可以通过估计非线性函数的加法组件来捕捉输入变量与响应变量之间的复杂关系。

通过本文,我们将展示如何帮助客户在R语言中使用LASSO惩罚稀疏加法模型(SPAM)来拟合非线性数据,并进行相应的可视化分析。

本文提供了一个代码来设置、拟合和可视化加法模型。数值特征会自动使用样条基函数进行扩展。这个基本思想最早是由Ravikumar等人在2009年提出的,他们称之为SPAM,即稀疏加法模型。最初的提议涉及到组套索lasso惩罚,但grpreg的任何惩罚函数都可以代替。基本用法如下所示。

非线性数据:

image.png

   

dim(Data$X)
# [1] 1000   16

矩阵包含 16 个数字特征。

生成的对象是一个列表,其中包含扩展矩阵和分组分配,以及一些内部函数所需的元数据。使用具有三个自由度的自然三次样条曲线。

现在可以将扩展后的矩阵传递给 :grpreg()

   
fit <- grpreg

请注意,在这种情况下不必传递分组信息,因为分组信息包含在对象中。

   
plot_spline(fit,

偏残差也可包含在这些图中:

   
plot_splinpartial=TRUE)

image.png

默认情况下,这些图的居中值为 x(的平均值(其中 x表示正在绘制的特征)的平均值为零时,y值为零。另一种情况是,如果指定了plot_spline()x,则将绘制一幅纵轴代表模型预测值的曲线图,所有其他特征都固定为平均值:

   
plot_spline(fit, "V02, type='conditional')

在比较这两幅图时,请注意总体轮廓是相同的,唯一不同的是纵轴的值。下面是前 9 个系数的曲线图:

image.png

   
for (i in 1:9) ploline(fit

plot_all_6-1.png

在生成模型中,变量 3 和 4 与结果呈线性关系,变量 1、2、5 和 6 呈非线性关系,而所有其他变量均不相关。稀疏加法模型很好地捕捉到了这一点。

进行交叉验证(默认情况下会绘制出使交叉验证误差最小的拟合结果):

   
cvfit <- cv.grp
plot_line

image.png

最后,这些工具还可用于生存模型和 glm 模型。在这里,所有绘图都以线性预测尺度返回,残差为偏差残差。


a-winning-strategy-for-growth-investors-at-a-time-of-uncertainty-1403128203-thumb-1536x1536.webp

最受欢迎的见解

1.数据类岗位需求的数据面

2.探析大数据期刊文章研究热点

3.机器学习助推快时尚精准销售预测

4.用机器学习识别不断变化的股市状况—隐马尔科夫模型(HMM)的应用

5.数据聆听人民网留言板的那些“网事”

6.在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析

7.用数据解读体育决策:挖掘体育赛事新价值

8.把握出租车行驶的数据脉搏

9.智能门锁“剁手”数据攻略

标签:非线性,SPAM,模型,拟合,可视化,加法,数据,lasso
From: https://www.cnblogs.com/tecdat/p/17647212.html

相关文章

  • R语言PCA主成分、lasso、岭回归降维分析全球气候变化对各国土地面积影响|附代码数据
    全文链接:http://tecdat.cn/?p=31445最近我们被客户要求撰写关于各国土地面积的研究报告,包括一些图形和统计输出。机器学习在环境监测领域的应用,着眼于探索全球范围内的环境演化规律,人类与自然生态之间的关系以及环境变化对人类生存的影响。课题着眼于环境科学中的近年来土地面......
  • 视频汇聚平台EasyCVR安防监控视频平台关于体育馆可视化的设计应用方案
    一、方案背景最近,成都大运会圆满结束,杭州亚运会即将开幕,大型体育赛事给人们带来了精神文化享受的同时,也由于人数众多、信息密集等原因,体育场馆发生的突发情况增多。因此,构建可视化安全防范系统成为体育场馆数字化建设的重要任务。二、建设目标及要求以预防和处置突发事件为核心,实......
  • 视频汇聚平台EasyCVR安防监控视频平台关于体育馆可视化的设计应用方案
    一、方案背景最近,成都大运会圆满结束,杭州亚运会即将开幕,大型体育赛事给人们带来了精神文化享受的同时,也由于人数众多、信息密集等原因,体育场馆发生的突发情况增多。因此,构建可视化安全防范系统成为体育场馆数字化建设的重要任务。  二、建设目标及要求......
  • 无涯教程-TensorFlow - TensorBoard可视化
    TensorFlow包含一个可视化工具,称为TensorBoard,它用于分析数据流图,还用于了解机器学习模型。TensorBoard的重要功能包括查看有关垂直对齐的任何图形的参数和详细信息的不同类型统计的视图。深度神经网络包括多达36,000个节点。TensorBoard帮助将这些节点折叠成块并突出显示相同......
  • Google开源了可视化编程框架Visual Blocks for ML
    VisualBlocksforML是一个由Google开发的开源可视化编程框架。它使你能够在易于使用的无代码图形编辑器中创建ML管道。为了运行VisualBlocksforML。需要确保你的GPU是可以工作的。剩下的就是clone代码,然后运行,下面我们做一个简单的介绍:VisualBlocksforML是运行在支持jav......
  • 基于Python的招聘网站爬虫及可视化的实现-计算机毕业设计源码+LW文档
    开发语言:Python框架:flaskPython版本:python3.7.7数据库:mysql5.7(一定要5.7版本)数据库工具:Navicat11开发软件:PyCharm浏览器:谷歌浏览器DROPTABLEIFEXISTSa6woc_zhaopinxinxi;/*!40101SET@saved_cs_client=@@character_set_client/;/!40101SETcharacter_set_cli......
  • 数据时代的引擎:BI工具和数据可视化助力企业腾飞
    在当今数据驱动的时代,企业越来越需要深入了解自身运营情况,以便做出明智的决策和战略规划。在这个背景下,商业智能(BusinessIntelligence,简称BI)工具和数据可视化技术逐渐崭露头角,成为企业成功的关键因素之一。 BI工具是现代企业管理的得力助手,它们不仅能够帮助企业从庞杂的数据中......
  • 使用 OpenCV Python 检测和可视化两个图像之间的差异
    使用OpenCVPython检测和可视化两个图像之间的差异转自:使用OpenCVPython检测和可视化两个图像之间的差异-Glasshost如果您需要比较两个图像并确定它们之间的差异,OpenCVPython提供了一种简单有效的方法来完成此任务。本指南将向您展示如何使用OpenCVPython检测和可视......
  • 交通枢纽智能可视化综合管理系统解决方案
    一、行业需求交通枢纽是城市管理中一个典型的跨应用场景,如铁路、公路、航空、内河航运、海港等,人流、车流量较多,环境复杂,易发生突发情况,因此安全和安保是非常重要的考虑因素。交通枢纽的运营管理体系建设需要考虑到人员疏散、消防设施、监控系统等方面的安全要求,以防止恐怖袭击和其......
  • Autodesk Inventor Professional 2024(三维可视化实体模拟软件)中文永久使用
    AutodeskInventorProfessional2024是一款功能强大的三维计算机辅助设计(CAD)软件,以下是对其的详细介绍:点击获取AutodeskInventorProfessional2024 三维建模工具:AutodeskInventorProfessional2024提供了丰富的三维建模工具,使用户能够创建复杂的实体模型。用户可以......