首页 > 其他分享 >如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据

如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据

时间:2024-01-29 21:22:37浏览次数:35  
标签:LCMM 类别 Latent 语言 模型 效应 混合 老年痴呆 线性

全文下载链接:http://tecdat.cn/?p=24647

最近我们被客户要求撰写关于LCMM的研究报告,包括一些图形和统计输出。

线性混合模型假设 N 个受试者的群体是同质的,并且在群体水平上由独特的曲线 Xi(t)β 描述 。

背景和定义

相比之下,潜在类别混合模型在于假设人口是异质的,并且由 G 潜在类别的受试者组成,其特征是 G 平均轨迹曲线。

潜类别混合模型

潜在类别成员由离散随机变量 ci 定义,如果主题 i 属于潜在类别 g (g = 1, …,G),则该变量等于 g。变量 ci 是潜在的;根据协变量 Xci 使用多项逻辑模型描述其概率:

图片

其中 ξ0g 是 g 类的截距,ξ1g 是与时间无关协变量 Xci 的 q1 向量相关的类特定参数的 q1 向量。当没有协变量预测潜在类成员资格时,该模型将简化为特定于类的概率。

后验分类

在涉及潜在类别的模型中,可以对每个潜在类别中的主体进行后验分类。它基于类成员概率的后验计算,用于表征对象的分类以及评估模型的拟合优度(Proust-Lima et al. 2014  ).

使用贝叶斯定理计算后类成员概率作为给定收集信息的潜在类的概率。在纵向模型中,它们为主题 ii 和潜在类别 g 定义为:

图片

其中:  θ^G 是 G 潜在类模型中估计的参数向量。

高斯数据示例

在此示例中,我们研究了认知标记的二次轨迹,即在老年人样本(纳入时年龄 65 岁及以上)中进行预先标准化(具有高斯分布)并对简易智能量表评分 ( MMSE )进行了长达 15 年的跟踪研究,可根据教育水平进行调整。尽管可以考虑任何回归,但模型在此处不考虑交互作用。

数据集

子样本

这是来自原始前瞻性研究 的 500 名受试者的子样本。该数据集不能用于流行病学目的,因为子样本不代表原始队列(特别是痴呆病例已被过度采样)。

用于可视化数据(仅限表头):

   
head(data)

图片

在不同的时间收集不同的标记。在数据集中,时间尺度是年龄。

获取数据的快速摘要:

   
summary(data)

图片

一些变量有缺失值。

简易智能量表评分结果

简易智能量表评分通常被视为结果。简易智能量表评分是一种非常常见的神经心理学测试,用于测量老年人的整体认知功能。它具有非常不对称的分布,因此通常将其归一化以应用于高斯变量的方法。预归一化函数完成的:

   
 hist( MMSE )

hist( norm )

图片

要建模单个重复测量是:

   
color <-ID

xyplot

图片

考虑的模型

我们考虑以下潜在类线性混合模型,其中 g 表示类别,i表示主题,j 表示重复测量:

图片

其中_:_

图片 和 图片

固定效应部分 是 图片 混合 图片 和 图片; 在 随机效应部分 是 图片,

因变量:归一化 简易智能量表评分

由于 简易智能量表评分的分布非常倾斜,我们使用标准化版本

   
normMMSE <- norm

估计只有一个类的模型 (G=1)

根据年龄进行分析。为了避免任何数值问题,我们重新调整和标准化年龄:

   
 

age65 <- (age - 65)/10

我们为 norm 拟合线性混合模型:

   
 
lme(norm ~ age65+I(age65^2)+CEP rand =~ age65+I(age65^2) subject = 'ID'

估计具有多个类的模型 (G > 1)

从通过假设单个潜在类估计的模型,我们现在可以搜索异构概况。下一行提供了使用  G>1 时初始值对 2 个潜在类的模型的估计。

   
 

#考虑到2类的估计
lme(ng = 2, mix=~age65+I(age65^2))

初始值

初始值在参数中指定 B。该选项会 B=m1 根据 1 类模型(此处为m1)的最大似然估计自动生成初始值 。不指定B 或 不指定 B=NULL 是不推荐的,因为它会导致 G=1G=1 的模型的内部预估计(即 m1),这可能会显着增加计算时间。


点击标题查阅往期内容

图片

R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

用户预先指定的值

在以下示例中,初始值由用户预先指定:方差协方差的参数取自线性混合模型的估计值,并针对特定于类尝试任意初始值:

   
lme( B = c(0, 50, 30, 3, -1))

随机生成的值

另一种方法是从 1 类模型的估计值的渐近分布中随机生成初始值(此处为 m1):

   
lme(rand(m1))

网格搜索

最后,grid可用于运行自动网格搜索。在接下来的示例中,G=2 和 G=3 类, hlme 从 100 个初始值的随机向量运行最多 30 次迭代。然后,仅针对在 30 次迭代后提供最佳对数似然的偏离完成估计程序。

   
grid(lme iter=30,)

推荐使用此方法,因为它可以在重复次数足够大且迭代次数相当大时更好地探索参数空间。

选择最佳模型

一组模型(通常具有不同数量的潜在类)的估计过程可以用 来概括 summary

   
summary

图片

我们在这里总结了我们之前估计的 6 个模型。我们可以看到所有的 2-class 模型都收敛于同一个估计点。

这个例子说明了定义“潜在类的最佳数量”的复杂性。事实上,根据推荐的 BIC,应该保留 2 类模型(因为它提供了最低值)。但是 AIC 和 Size 调整 BIC(涉及较小的惩罚)都支持 3-class 模型。熵也有利于 3 类模型,因为它具有更好的判别能力(熵接近 1)。最后,3-class 模型创建了一个非常小的类,这通常不是那些搜索和感兴趣的异质性。在这个例子中,根据统计和临床标准,2-或 3-可以保留类模型。下面,我们保留了最终输出描述的 2-class 模型。

2-class 线性混合模型的描述

模型概要

   
 

summary(m2d)

图片

图片

图片

图片

模型的预测

只要模型中指定的所有协变量都包含在数据框中,就可以为数据框中包含的任何数据计算特定于类的预测。在接下来的几行中,通过生成年龄值介于 65 和 95 之间的向量并将 CEP定义为 1 或 0,来创建这样的数据框 。计算和绘制 预测 。

   
data.frame(age=seq(65,95,l=50))

在点估计中为每个类计算预测:

   
predictY

然后可以绘制预测:

   
plot(prd0)

plot(prd1,add=TRUE)

图片

如果我们想了解可变性,我们可以计算具有置信区间的预测并绘制它们:

   
plot(IC,, shades=TRUE)

图片

最后,1 类、2 类和 3 类模型的预测轨迹可以一起表示在下图中:

   
par(mfrow=c(1,3))

plot(pr1 )

plot(pr0  

plot(pr3)

图片

最终潜在类混合模型的评估

残差图

   
 

plot(m)

图片

预测与观察的图表

为了评估所选模型的拟合,我们同时绘制每个潜在类别的观察值和预测值。

   
plot(m, shad = TRUE)

图片

该图在此处显示了对数据的非常好的拟合。

分类

模型的后验分类通过以下方式获得:

   
postprob(m2d)

图片

图片

Class 1 由 62 个样本 (12.4%) 组成,而 438 个样本属于第二类。

我们还可以通过以下方式查看有关模型辨别能力的信息:

  • 后验分类表:分类在 class 1 (resp.  class 2) 中的对象属于该类的平均概率为 0.8054 (resp. 0.8730)。这显示了类别的良好区分。
  • 高于阈值的分类的比例:这里 90.18%(分别为 61.29%)的第 1 类(分别为 2)的后验概率大于 70%。

图片

本文摘选 《R语言潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据》 ,点击“阅读原文”获取全文完整资料。

图片

点击标题查阅往期内容

R语言贝叶斯广义线性混合(多层次/水平/嵌套)模型GLMM、逻辑回归分析教育留级影响因素数据R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
R语言因子实验设计nlme拟合非线性混合模型分析有机农业施氮水平
R语言非线性混合效应 NLME模型(固定效应&随机效应)对抗哮喘药物茶碱动力学研究
R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系
R语言LME4混合效应模型研究教师的受欢迎程度R语言nlme、nlmer、lme4用(非)线性混合模型non-linear mixed model分析藻类数据实例
R语言混合线性模型、多层次模型、回归模型分析学生平均成绩GPA和可视化
R语言线性混合效应模型(固定效应&随机效应)和交互可视化3案例
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据R语言 线性混合效应模型实战案例
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言建立和可视化混合效应模型mixed effect model
R语言LME4混合效应模型研究教师的受欢迎程度
R语言 线性混合效应模型实战案例
R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题
基于R语言的lmer混合线性回归模型
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
R语言分层线性模型案例
R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据
用SPSS估计HLM多层(层次)线性模型模型

标签:LCMM,类别,Latent,语言,模型,效应,混合,老年痴呆,线性
From: https://www.cnblogs.com/tecdat/p/17995360

相关文章

  • R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程|附代码数据
    全文链接:http://tecdat.cn/?p=24172 最近我们被客户要求撰写关于潜过程混合效应模型(lcmm)的研究报告,包括一些图形和统计输出。每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。有时,这个潜过程是通过几个标志来衡量的,因此潜过程是它们的共同因素。多......
  • 2020CVPR_High-Resolution Image Synthesis with Latent Diffusion Models
    1.AutoEncoderAutoEncoder(自编码器)是一种无监督学习的神经网络模型,用于学习有效的数据表示。它的目标是将输入数据编码成一种潜在的、紧凑的表示形式,然后从这个表示中重构原始输入。自编码器由两部分组成:编码器(Encoder)和解码器(Decoder)。编码器(Encoder):将输入数据映射到潜在表示空......
  • A Latent Hidden Markov Model for Process Data读文献笔记
    【个人笔记】:笔记(ALatentHiddenMarkovModelforProcessData)\SummaryResponseprocessdatafromcomputer-basedproblem-solvingitemsdescriberespondents'problem-solvingprocessesassequencesofactions.Suchdataprovideavaluablesourcefor......
  • [论文阅读] Latent Consistency Models@ Synthesizing High-Resolution Images with F
    1.Pretitle:LatentConsistencyModels:SynthesizingHigh-ResolutionImageswithFew-StepInferenceaccepted:arXiv2023(ICLR2024Submission)paper:https://arxiv.org/abs/2303.01469code:https://github.com/openai/consistency_modelsref:https://mp.wei......
  • 简单易学的机器学习算法——Latent Dirichlet Allocation(理论篇)
    引言LDA(LatentDirichletAllocation)称为潜在狄利克雷分布,是文本语义分析中比较重要的一个模型,同时,LDA模型中使用到了贝叶斯思维的一些知识,这些知识是统计机器学习的基础。为了能够对LDA原理有清晰的认识,也为了能够对贝叶斯思维有全面的了解,在这里对基本知识以及LDA的相关知识进......
  • [论文速览] SDXL@ Improving Latent Diffusion Models for High-Resolution Image Syn
    Pretitle:SDXL:ImprovingLatentDiffusionModelsforHigh-ResolutionImageSynthesisaccepted:arXiv2023paper:https://arxiv.org/abs/2307.01952code:https://github.com/Stability-AI/generative-models关键词:imagesynthesis,stablediffusion,SDXL,AICG......
  • Latent Diffusion Model搭建过程
    目录源码拷贝虚拟环境VSCode带命令行参数运行py文件问题记录此方式在服务器(Ubuntu)上安装StableDiffusion,使用miniconda虚拟环境。在Windows10系统上使用VScode远程开发方法进行调试和运行。注意:使用VSCode连接服务器远程开发调试,代码中的相对路径是打开文件夹的路径,并不是当前......
  • Latent Diffusion Model快读
    总览  原始的扩散模型训练及推理是在像素空间进行的,这将耗费大量的GPU和能量资源。为了缓解这一状况,作者提出了一种方案,将高分辨率图像的合成过程分解为两个过程:图像编解码和隐特征空间扩散。图像编码器将像素空间中图像编码为隐特征latentcode(生成过程不需要此步骤)扩散模......
  • R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状|附代码数据
    全文下载链接:http://tecdat.cn/?p=22206最近我们被客户要求撰写关于潜类别混合效应模型(LCMM)的研究报告,包括一些图形和统计输出。每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化。模型背景当对重复测量的标志变量进行建模时,我们通常不会把它看成......
  • High-Resolution Image Synthesis with Latent Diffusion Models
    目录概大概流程代码RombachR.,BlattmannA.,LorenzD.,EsserP.andOmmerB.High-resolutionimagesynthesiswithlatentdiffusionmodels.InIEEEComputerV......