首页 > 其他分享 >R语言 Lasso系数置信区间计算

R语言 Lasso系数置信区间计算

时间:2023-12-14 18:33:40浏览次数:573  
标签:load 置信区间 系数 library Lasso lasso

真是神了奇了,还能被审稿人问到Lasso系数的置信区间的信息,还好有现成的工具可以计算

 

# load library

library(selectiveInference)

library(xlsx)
library(glmnet)

# load data
setwd("E:\\UAI_Program\\2-ZhongshanHospital\\12-xiaoyuyao系数置信区间")
Data <- read.xlsx("R.xlsx",sheetIndex=1)
dim(Data)

x <- as.matrix(Data[,-1])
y <- as.matrix(Data[,1])

# lasso anallysis
set.seed(100)
cvfit <- cv.glmnet(x, y, type.measure = "mse", nfolds = 10, alpha = 1)
lambda <- cvfit $ lambda.min
Variable <- coef(cvfit$glmnet.fit,s=lambda,exact = F)@Dimnames[[1]]
coefficients <- coef(cvfit$glmnet.fit,s=lambda ,exact = F)
COl <- which(coefficients!=0) #系数不为0的特征索引
VariableLast <- data.frame(Factor=Variable[COl],coefficients[COl])

# lasso models for CI
x <- as.matrix(Data[,which(names(Data) %in% VariableLast[-1,1])])
set.seed(100)
cvfit2 <- glmnet(x, y, type.measure = "mse", nfolds = 10, alpha = 1,family='gaussian',standardize=T)
beta <- coef(cvfit2, x=x, y=y, s=lambda/nrow(Data), exact=T)[-1]

out <- fixedLassoInf(x,y,beta,lambda,sigma=1,family='gaussian')
out

标签:load,置信区间,系数,library,Lasso,lasso
From: https://www.cnblogs.com/wf-strongteam/p/17901748.html

相关文章

  • 数学建模之相关系数模型及其代码
    发现新天地,欢迎访问小铬的主页(www.xiaocr.fun)引言本讲我们将介绍两种最为常用的相关系数:皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数。它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错......
  • MATLAB用Lasso回归拟合高维数据和交叉验证|附代码数据
    原文链接:http://tecdat.cn/?p=25741原文出处:拓端数据部落公众号此示例显示如何 lasso 识别和舍弃不必要的预测变量。使用各种方法从指数分布生成200个五维数据X样本。 htmlrng(3,'twister')%实现可重复性fori=1:5X(:,i)=exprndend生成因......
  • 相关性系数及其python实现 (转)
    转自: https://www.cnblogs.com/sddai/p/10332573.html参考文献:1.python皮尔森相关系数 https://www.cnblogs.com/lxnz/p/7098954.html2.统计学之三大相关性系数(pearson、spearman、kendall) http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html 1.personcorrelatio......
  • 基于图卷积网络的关系数据建模
    Abstract​ 知识图谱实现了各种各样的应用,包括问题回答和信息检索。尽管在创建和维护方面投入了巨大的努力,但即使是最大的知识库(如Yago、DBPedia或Wikidata)仍然不完整。我们介绍了关系图卷积网络(R-GCNs)并将其应用于两个标准的知识库补全任务:链接预测(恢复缺失的事实,即主题-预测-对......
  • R语言群组变量选择、组惩罚group lasso套索模型预测分析新生儿出生体重风险因素数据和
    原文链接:http://tecdat.cn/?p=25158原文出处:拓端数据部落公众号 本文拟合具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso、组MCP。还提供了进行交叉验证以及拟合后可视化、总结和预测的实......
  • 分子沉降系数
    分子沉降系数分子沉降系数是用离心法时,大分子沉降速度的量度,等于每单位离心场的速度。或s=v/ω^2?r。s是沉降系数,ω是离心转子的角速度(弧度/秒),r是到旋转中心的距离,v是沉降速度。分子沉降系数以每单位重力的沉降速度表示,(thevelocityperunitforce)并且通常为1~200×10^-13秒范......
  • Python用正则化Lasso、岭回归预测房价、随机森林交叉验证鸢尾花数据可视化2案例
    机器学习模型的表现不佳通常是由于过度拟合或欠拟合引起的,我们将重点关注客户经常遇到的过拟合情况。过度拟合是指学习的假设在训练数据上拟合得非常好,以至于对未见数据的模型性能造成负面影响。该模型对于训练数据中没有的新实例的泛化能力较差。复杂模型,如随机森林、神经网络和X......
  • 关系数据库的表设计规范:五范式
    第一范式(1NF):确保每个数据字段都是原子性的,即不可再分。每个字段只能包含一个值,不允许多个值或重复的数据。第二范式(2NF):在满足1NF的基础上,确保所有非主键字段完全依赖于整个主键,而不是部分主键。换句话说,每个非主键字段必须与主键相关,不能只与主键的一部分相关。第三范式(3N......
  • R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析
    原文链接:http://tecdat.cn/?p=22702原文出处:拓端数据部落公众号 摘要贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯。还包括总结结果、绘制路径图、后验直方图、自相关图和绘制分位数图......
  • 关系数据库
    一、关系数据结构及形式化定义1.1关系  关系模型的数据结构只包含单一的数据结构------关系,在关系模型中,现实世界的实体以及实体之间的各种联系均用单一的结构类型,即关系来表示。关系模型是建立在集合代数的基础上的,从集合论的角度给出关系数据结构的形式化定义。 1、域:一......