R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

时间：2024-01-25 23:56:51浏览次数：28

标签：模型效应混合 Intercept m1 线性

原文链接：http://tecdat.cn/?p=3138

原文出处：拓端数据部落公众号

随着软件包的进步，使用广义线性混合模型（GLMM）和线性混合模型（LMM）变得越来越容易。由于我们发现自己在工作中越来越多地使用这些模型，我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。

shiny的应用程序和演示

演示此应用程序功能的最简单方法是使用Shiny应用程序，在此处启动一些指标以帮助探索模型。

在第一个选项卡上，该函数显示用户选择的数据的预测区间。该函数通过从固定效应和随机效应项的模拟分布中抽样并组合这些模拟估计来快速计算预测区间，以产生每个观察的预测分布。

在下一个选项卡上，固定效应和组级效果的分布在置信区间图上显示。这些对于诊断非常有用，并提供了检查各种参数的相对大小的方法。

在第三个标签上有一些方便的方法，显示效果的影响或程度predictInterval。对于每种情况，最多12个，在所选数据类型中，用户可以查看更改固定效应的影响。这允许用户比较变量之间的效果大小，以及相同数据之间的模型之间的效果大小。

预测

预测像这样。

predict(m1, newdata
#>        1        2        3        4        5        6        7        8
#> 3.146336 3.165211 3.398499 3.114248 3.320686 3.252670 4.180896 3.845218
#>        9       10
#> 3.779336 3.331012

预测lm和glm：

predInte(m1, newdata = Eval[1:10, ], n.sims = 500, level = 0.9,
#>         fit      lwr      upr
#> 1  3.074148 1.112255 4.903116
#> 2  3.243587 1.271725 5.200187
#> 3  3.529055 1.409372 5.304214
#> 4  3.072788 1.079944 5.142912
#> 5  3.395598 1.268169 5.327549
#> 6  3.262092 1.333713 5.304931

预测区间较慢，因为它是模拟计算。

可视化

可视化检查对象的功能。最简单的是得到固定和随机效应参数的后验分布。

head(Sim)
#>          term        mean      median         sd
#> 1 (Intercept)  3.22673524  3.22793168 0.01798444
#> 2    service1 -0.07331857 -0.07482390 0.01304097
#> 3   lectage.L -0.18419526 -0.18451731 0.01726253
#> 4   lectage.Q  0.02287717  0.02187172 0.01328641
#> 5   lectage.C -0.02282755 -0.02117014 0.01324410

我们可以这样绘制：

pltsim(sim(m1, n.sims = 100), level = 0.9, stat = 'median'

我们还可以快速制作随机效应的图：

head(Sims)
#>   groupFctr groupID        term        mean      median        sd
#> 1         s       1 (Intercept)  0.15317316  0.11665654 0.3255914
#> 2         s       2 (Intercept) -0.08744824 -0.03964493 0.2940082
#> 3         s       3 (Intercept)  0.29063126  0.30065450 0.2882751
#> 4         s       4 (Intercept)  0.26176515  0.26428522 0.2972536
#> 5         s       5 (Intercept)  0.06069458  0.06518977 0.3105805

plotR((m1, n.sims = 100), stat = 'median', sd = TRUE

有时，随机效应可能难以解释

 Rank(m1, groupFctr = "d")
head(ranks)
#>      d (Intercept) (Intercept)_var       ER pctER
#> 1 1866   1.2553613     0.012755634 1123.806   100
#> 2 1258   1.1674852     0.034291228 1115.766    99
#> 3  240   1.0933372     0.008761218 1115.090    99
#> 4   79   1.0998653     0.023095979 1112.315    99
#> 5  676   1.0169070     0.026562174 1101.553    98
#> 6   66   0.9568607     0.008602823 1098.049    97

效果模拟

解释LMM和GLMM模型的结果很困难，尤其是不同参数对预测结果的相对影响。


impact(m1, Eval[7, ], groupFctr = "d", breaks = 5,
n.sims = 300, level = 0.9)

#>   case bin   AvgFit     AvgFitSE nobs
#> 1    1   1 2.787033 2.801368e-04  193
#> 2    1   2 3.260565 5.389196e-05  240
#> 3    1   3 3.561137 5.976653e-05  254
#> 4    1   4 3.840941 6.266748e-05  265
#> 5    1   5 4.235376 1.881360e-04  176

结果表明yhat根据我们提供的newdata在组因子系数的大小方面，从第一个到第五个分位数的变化。

ggplot(impSim, aes(x = factor(bin), y = AvgFit, ymin = AvgFit - 1.96*AvgFitSE,
ymax = AvgFit + 1.96*AvgFitSE)) +

非常感谢您阅读本文，有任何问题请在下面留言！

最受欢迎的见解

1.基于R语言的lmer混合线性回归模型

2.R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

3.R语言线性混合效应模型实战案例

4.R语言线性混合效应模型实战案例2

5.R语言线性混合效应模型实战案例

6.线性混合效应模型Linear Mixed-Effects Models的部分折叠Gibbs采样

7.R语言LME4混合效应模型研究教师的受欢迎程度

8.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

9.使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

标签：模型,效应,混合,Intercept,m1,线性
From： https://www.cnblogs.com/tecdat/p/17988443

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化
原文链接：http://tecdat.cn/?p=22732 原文出处：拓端数据部落公众号关联规则挖掘是一种无监督的学习方法，从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中，我将解释如何在R中提取关联规则。关联规则模型适用于交易数据。交易数据的一个例子可以......
SPSS Modeler决策树分类模型分析商店顾客消费商品数据
全文链接：https://tecdat.cn/?p=34926原文出处：拓端数据部落公众号随着大数据时代的来临，数据挖掘和分析在商业决策中扮演着越来越重要的角色。商店的顾客消费行为数据是商业决策的关键信息之一，通过对这些数据的深入分析，可以更好地理解顾客的消费习惯和偏好，从而优化商品销售策略，提......
NLP 之四：双向预训练模型
利用预训练好的模型进行微调（Fine-tune），可以获得比传统模型的巨大提升。此时学习率一般是正常的十分之一（\(10^{-5}\)左右）。也可以保持预训练的参数不变。Transformer架构Encoder-only：擅长分类任务Decoder-only：擅长生成任务Encoder-only：混合情况（例如文本翻译、总结）在无监督......
线性表 - 栈和队列
栈后进先出LIFO两种实现方式使用数组实现的叫静态栈使用链表实现的叫动态栈相关题目简单难度225.用队列实现栈https://leetcode.cn/problems/implement-stack-using-queues/classMyStack{ privateQueue<Integer>q1; privateQueue<Integer>q2; ......
一文深度解读多模态大模型视频检索技术的实现与使用
当视频检索叠上大模型Buff。:::hljs-right万乐乐｜技术作者:::视频检索，俗称“找片儿”，即通过输入一段文本，找出最符合该文本描述的视频。随着视频社会化趋势以及各类视频平台的快速兴起与发展，「视频检索」越来越成为用户和视频平台实现高效查找视频、定位目标内容的新需求。......
Semantic Kernel 通过 LocalAI 集成本地模型
本文是基于LLama2是由Meta开源的大语言模型，通过LocalAI来集成LLama2来演示Semantickernel（简称SK）和本地大模型的集成示例。SK可以支持各种大模型，在官方示例中多是OpenAI和AzureOpenAIservice的GPT3.5+。今天我们就来看一看如何把SK和本地部署的开源大模型集成起来......
一文深度解读多模态大模型视频检索技术的实现与使用
当视频检索叠上大模型Buff。万乐乐｜技术作者视频检索，俗称“找片儿”，即通过输入一段文本，找出最符合该文本描述的视频。随着视频社会化趋势以及各类视频平台的快速兴起与发展，「视频检索」越来越成为用户和视频平台实现高效查找视频、定位目标内容的新需求。对于个人用户而言，面对......
行业应用 | Sophon AutoCV推动AI应用从模型生产到高效落地
随着技术市场和应用方向的逐渐成熟，人工智能与各行各业的结合和落地逐渐进入了深水区。虽然由于行业规模化和应用普及度的限制，人工智能在“传统”行业的落地不如消费互联网行业，但是借助人工智能为“传统”行业的发展注入新能量一直是相关从业者探索的方向和创造数据价值的重要途径。......
产品解读 | 新一代湖仓集存储，多模型统一架构，高效挖掘数据价值
星环科技TDH一直致力于给用户带来高性能、高可靠的一站式大数据基础平台，满足对海量数据的存储和复杂业务的处理需求。同时在易用性方面持续深耕，降低用户开发和运维成本，让数据处理平民化，助力用户以更便捷、高效的方式去挖掘数据价值。基于这样的宗旨，星环科技TDH正式发布了9.3版本。......
大模型Adaptation
Adaptation【Motivation】语言模型（给出提示后执行任务）不适用于所有下游任务（如自然语言推理（NLI）、问题回答（QA）、将网络表格转换为文本、解析电子健康记录（EHR）等）差别在于：语言模型的训练数据的格式和主题可能不同，或需要随时更新GPT3任务不可知，不针对特定任务优化，可以捕捉任务通用结......