首页 > 编程语言 >r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据

r语言有限正态混合模型EM算法的分层聚类、分类和密度估计及可视化|附代码数据

时间:2024-02-04 22:55:46浏览次数:36  
标签:EM 密度估计 plot 正态 BIC summary 聚类

原文链接:http://tecdat.cn/?p=23825

最近我们被客户要求撰写关于有限正态混合模型EM算法的研究报告,包括一些图形和统计输出。

简介

本文介绍了基于有限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具有各种协方差结构的正态混合模型进行参数估计的函数,以及根据这些模型进行模拟的函数。此外,还包括将基于模型的分层聚类、混合分布估计的EM和贝叶斯信息准则(BIC)结合在一起的功能,用于聚类、密度估计和判别分析的综合策略。其他功能可用于显示和可视化拟合模型以及聚类、分类和密度估计结果。

聚类

   

head(X)
       
pairs(X)

   
​
plot(BIC)

​

   
​

summary(BIC)

   
summary(mod1, parameters = TRUE)

 

 

   
plot(mod1)
   

   
table(class, classification)
​
       

plot(mod1, what = "uncertainty")

   
clustICL(X)
summary(ICL)
   

   
​

BootstrapLRT(X)
   

初始化

使用EM算法进行最大似然估计。EM的初始化是使用从聚类层次结构聚类中获得的分区来进行的。

   
​
 hclust(X, use = "SVD"))

   
clustBIC(X, initialization )) # 默认

 

   
hc2 

   
clustBIC(X, initialization )

 

   
hclust(X, model= "EEE"))

 

   

summary(BIC3)

 

通过合并最佳结果来更新BIC。

   
BIC(BIC1, BIC2, BIC3)

   


使用随机起点进行单变量拟合,通过创建随机集聚和合并最佳结果获得。

   

for(j in 1:20)
{
  rBIC <- mclustBIC(
                    initi ))
  BIC <- update(BIC, rBIC)
}
   

   
​
clust(ga, BIC)

   

分类

EDDA

   
X <- iris[,1:4]
head(X)

   
clustDA(X, class,  "EDDA")

   

plot(mod2)
​

MclustDA

   
​

table(class)

   
head(X)

   
clustDA(X, class)

   

plot(mod3, 2)

​

 

   
​

plot(mod3, 3)
​
   

交叉验证误差

   
​
cv(mod2, nfold = 10)

   

unlist(cv[3:4])

 

   
cv(mod3, nf = 10)

 

   

unlist(cv[3:4])

密度估计

单变量

   
clust(acid)

 

   

plot(mod4, "BIC")
​
   

   
plot(mod4,  "density", acidity)
 

   
​

plot(mod4, "diagnostic",  "cdf")
​
   

多变量

   
clu(faithful)
summary(mod5)

   

plot(mod5, "BIC")
​
   

   
​
 

plot(mod5, "density",faithful)
 

​

   

Bootstrap推理

   
​
summary(boot1, what = "se")

 

 

   
summary(boot1, what = "ci")

 

 

   

summary(boot4, what = "se")

plot(boot4)
​
   

降维

聚类

   
​

plot(mod1dr,  "pairs")
​

   

   
plot(mod1dr)

   
plot(mod1dr, "scatterplot")

   
plot(mod1dr)

分类

   
​

summary(mod2dr)

plot(mod2d)
​

   

   
plot(mod2dr)
 

   
​

summary(mod3dr)

plot(mod3dr)
​

   
plot(mod3dr)
 

​

使用调色板

大多数图形都使用默认的颜色。

调色板可以定义并分配给上述选项,具体如下。

   
options("Colors" = Palette )
Pairs(iris[,-5], Species)

​

   


如果需要,用户可以很容易地定义自己的调色板。

参考文献

Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, Journal of the American Statistical Association, 97/458, pp. 611-631.


最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

标签:EM,密度估计,plot,正态,BIC,summary,聚类
From: https://www.cnblogs.com/tecdat/p/18007166

相关文章

  • How to unlock Nissan Altima 2019-2022 Smart Remote 5 Buttons 433MHz Keys with Sm
    Howtounlock Nissan Altima2019-2022Smart Remote 5Buttons433MHzKeyswithSmartPro5000U-Plusfirst,youneedhavea SmartPro5000U-PlusProgrammer,ifyoudonothaveaSmartPro5000U-Plus,youcanbuyonefromchinaobd2.com.https://www.chinaobd2.co......
  • NTFS(New Technology File System)是Windows操作系统中使用的一种文件系统,它具有高级功
    NTFS(NewTechnologyFileSystem)是Windows操作系统中使用的一种文件系统,它具有高级功能和性能。NTFS文件系统的模型基于多个概念和组件,包括文件、目录、磁盘空间分配、访问控制等。下面是NTFS文件系统的技术原理和运作机制的简要介绍:文件和目录:NTFS使用树状结构组织文件和目录......
  • 【可观测性系列】 OpenTelemetry Collector的部署模式分析
    ......
  • Remix v0.42.0 更新日志
    重要讯息向GPT提问关于CircomZKP编译器的错误或警告问题Solidity默认版本变更为0.8.24,支持坎昆EVM版本工作空间模版‘Uniswapv4Periphery’更名为‘Uniswapv4Template’GPT帮助解决关于Circom的问题您尝试过使用Remix里的Circom编译器吗?如果没有,您......
  • Teamcenter AWC开发:调用SOA时,报错No SOA service for Bom-2008-06-StructureManagemen
    1、报错:2、分析:我一直在纠结,究竟是SOA接口报错。还是没有这个SOA接口服务。因为在AWC生成的SOA文档,是有这个接口和服务的。后来明白了。如果是SOA接口报错。在网络中看到这个接口是有响应的。也就是有返回的。 但是NoSOAservice报错,网络中,看到接口时没有返回的。 3......
  • webrtc终极版(二)搭建自己的iceserver服务,并用到RTCMultiConnection的demo中
    webrtc终极版(二)搭建自己的iceserver服务,并用到RTCMultiConnection的demo中目录webrtc终极版(二)搭建自己的iceserver服务,并用到RTCMultiConnection的demo中前言一、stunserver,turnserver,iceserver是什么?二、具体搭建步骤1.下载安装coturn2、处理证书问题3、处理各个ip以及端口的配......
  • Memory protection key in Linux
    MemoryProtectionKeysReference:MPKinLinuxkerneldocumentMemoryProtectionKeysforUserspace(PKUakaPKEYs)isafeaturewhichisfoundonIntel’sSkylake“ScalableProcessor”ServerCPUs.Itwillbeavalableinfuturenon-serverparts.Foranyone......
  • WASM_WebAssembly简单运行-hello,world
    WASMWASM可以被JavaScript调用,进入JavaScript上下文Wasm,即WebAssembly,是一种用来补充JS在运行上不足的“低级”语言——基于二进制编写-是一种新的字节码格式允许用户采用自己熟悉的语言书写(目前支持C/C++/Rust),再在虚拟机引擎在浏览器上运行。 它支持沙盒......
  • Problem P06. [算法课分治] 找到 k 个最长重复字符串
    注意是在该子字符串内每个字符的出现次数都不少于k。可以采用分治的方法,函数找一个不符合条件的字符,然后将字符串分成两个子字符串,就这样进行递归运算,每次找到符合条件的子字符串就判断一波长度,然后将最长的长度值存下来。#include<iostream>#include<bits/stdc++.h>#includ......
  • WIP: SLM-DB:Single-Level Key-Value Store with Persistent Memory
    论文原文:https://www.usenix.org/system/files/fast19-kaiyrakhmet.pdf摘要:本文调查了如何利用新出现的可按照字节寻址的持久化内存(PersistentMemory)来增强KV存储的性能。我们充分利用PM,提出了一种新型的KV存储,SLM-DB,这种存储同时利用到了B+树索引和LSM-tree的优点。我们提出......