首页 > 其他分享 >R语言K-Means(K-均值)聚类、朴素贝叶斯(Naive Bayes)模型分类可视化

R语言K-Means(K-均值)聚类、朴素贝叶斯(Naive Bayes)模型分类可视化

时间:2023-05-10 21:33:23浏览次数:52  
标签:Means Naive 分类 贝叶斯 算法 Bayes 聚类 类别 模型

全文链接:http://tecdat.cn/?p=32355

原文出处:拓端数据部落公众号

分类是把某个对象划分到某个具体的已经定义的类别当中,而聚类是把一些对象按照具体特征组织到若干个类别里。虽然都是把某个对象划分到某个类别中,但是分类的类别是已经预定义的,而聚类操作时,某个对象所属的类别却不是预定义的。所以,对象所属类别是否为事先,是二者的最基本区别。而这个区别,仅仅是从算法实现流程来看的。

本文帮助客户对数据进行聚类和分类,需要得到的结果是,聚类的二维效果图,聚类个数,聚类中心点值。 用聚类得到的结果贝叶斯建模后去预测分类。需要得到贝叶斯的模型精度,分类预测结果。

K-Means聚类成3个类别

聚类算法(clustering analysis)是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法。 K-means算法,也被称为K-平均或K-均值,是一种广泛使用的聚类算法,或者成为其他聚类算法的基础,它是基于点与点距离的相似度来计算最佳类别归属。几个相关概念:

K值:要得到的簇的个数;

质心:每个簇的均值向量,即向量各维取平均即可;

距离量度:常用欧几里得距离和余弦相似度(先标准化);

kmeans(data, 3)

聚类中心

image.png

聚类绘图

lusplot(data, fit$cluster

1111.png

1111.png

将数据使用kmean算法分成3个类别后可以看到 每个类别之间分布呈不同的簇,交集较少 ,因此 可以认为得到的聚类结果较好。

计算贝叶斯训练模型

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法 。

和决策树模型相比,朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。

朴素贝叶斯算法(Naive Bayesian algorithm) 是应用最为广泛的分类算法之一。

也就是说没有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小的比重。

虽然这个简化方式在一定程度上降低了贝叶斯分类算法的分类效果,但是在实际的应用场景中,极大地简化了贝叶斯方法的复杂性。

head(train)

image.png

建立贝叶斯模型

naiveBayes(as.factor(clus

image.png

贝叶斯的模型精度

tab=table(preds,train[,ncol(train)])#分类混淆矩阵  
tab

image.png

进行预测

predict(m, datapred,type="clas

预测分类

preds

image.png

K-Means聚成两个类别

fit <- kmeans(dat

聚类中心

fit$centers

image.png

usplot(data, fit

image.png

image.png

将数据使用kmean算法分成2个类别后可以看到每个类别之间分布呈不同的簇,交集较少 ,因此可以认为得到的聚类结果较好。

建立贝叶斯模型

naiveBayes(as.factor(clu

image.png

贝叶斯的模型精度

table(preds,train[,n

image.png

进行预测

predict(m, datapred,type="cla

image.png


ignite-growth-1536x1536-f.webp

最受欢迎的见解

1.R语言k-Shape算法股票价格时间序列聚类

2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图

3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的层次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本挖掘聚类

7.R语言KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化

8.PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

标签:Means,Naive,分类,贝叶斯,算法,Bayes,聚类,类别,模型
From: https://www.cnblogs.com/tecdat/p/17389393.html

相关文章

  • vue naive ui 前端获取日期数据传递给后端
    vuenaiveui前端获取日期数据传递给后端设置日期选择器1.使用表单输入绑定的方法把用户选定的日期传递给data中的值(检查数据是否更新的方法) 2.返回给后端的时间格式后端想要接收的格式为json,其中包括starttimeendtime和macid,并且时间格式为<class'datetime.date......
  • 关键词:光伏聚类 K-means聚类 时间序列
    关键词:光伏聚类K-means聚类时间序列编程语言:matlab主题:基于k-means算法的光伏时间序列聚类主要内容:本代码研究大量随机场景下光伏序列聚类与削减问题,首先,生成大量光伏随机场景,其次,在此基础上,基于Kmeans算法,对该大规模场景进行聚类,从而实现大规模场景的削减,最后,依据削减后的场......
  • m分别使用meanshift和camshift两种算法实现人员跟踪并输出人员移动曲线matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:    2.算法涉及理论知识概要       meanshift算法其实通过名字就可以看到该算法的核心,mean(均值),shift(偏移),简单的说,也就是有一个点,它的周围有很多个点 我们计算点 移动到每个点 所需要的偏移量之和,求平均,就得到......
  • form-create-designer-naiveui
    这个是Vue3版本form-create-designer-naiveui是基于@form-create/naive-uivue3版本实现的表单设计器组件。可以通过拖拽的方式快速创建表单,提高开发者对表单的开发效率,节省开发者的时间。form-create-designer是基于@form-create/element-ui开发的表单设计器,本项目更换......
  • KMeans算法与GMM混合高斯聚类
    一、K-MeansK-Means是GMM的特例(硬聚类,基于原型的聚类)。假设多元高斯分布的协方差为0,方差相同。 K-Means算法思想对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。N个d维样本,时间复杂度O(kLNd)初始......
  • MATLAB代码:基于改进K-means算法的含电动汽车负荷源荷场景聚类
    MATLAB代码:基于改进K-means算法的含电动汽车负荷源荷场景聚类关键词:有序聚类 改进k-means聚类电动汽车负荷聚类风光场景聚类 仿真平台:MATLAB主要内容:代码主要做的是基于改进k-means算法的场景生成,具体为含有电动汽车负荷的场景聚类问题,其中,光电和电负荷用有序聚类方法,风......
  • A NAIVE CON2D CPU IMPL
    /******************************************************************************WelcometoGDBOnline.GDBonlineisanonlinecompileranddebuggertoolforC,C++,Python,Java,PHP,Ruby,Perl,C#,OCaml,VB,Swift,Pascal,Fortran,Haskell,Objective......
  • 数据分享|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病|附代码
    全文链接:http://tecdat.cn/?p=23061最近我们被客户要求撰写关于预测心脏病的研究报告,包括一些图形和统计输出。这个数据集可以追溯到1988年,由四个数据库组成。克利夫兰、匈牙利、瑞士和长滩。"目标"字段是指病人是否有心脏病。它的数值为整数,0=无病,1=有病数据集信息:目标:主......
  • R语言Kmeans聚类、PAM、DBSCAN、AGNES、FDP、PSO粒子群聚类分析iris数据结果可视化比
    全文链接:http://tecdat.cn/?p=32007原文出处:拓端数据部落公众号本文以iris数据和模拟数据为例,帮助客户了比较R语言Kmeans聚类算法、PAM聚类算法、DBSCAN聚类算法、AGNE......
  • 机器学习算法(二): 基于鸢尾花数据集的朴素贝叶斯(Naive Bayes)预测分类
    机器学习算法(二):基于鸢尾花数据集的朴素贝叶斯(NaiveBayes)预测分类项目链接参考:https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc1.实验室介绍1.1......