首页 > 其他分享 >240717 聚类 kmean

240717 聚类 kmean

时间:2024-09-01 10:52:34浏览次数:19  
标签:plt min max kmean values 聚类 np 240717 data


结果:

240717 聚类 kmean_机器学习

240717 聚类 kmean_数据挖掘_02

无监督学习是一种对不含标记的数据建立模型的机器学习范式。 
~~
k-means算法是最流行的聚类算法之一。 这个算法常常利用数据的不同属性将输入数据划分
为k组。 分组是使用最优化的技术实现的, 即让各组内的数据点与该组中心点的距离平方和最小
化。

代码

# -*- coding: utf-8 -*-
 import numpy as np
 import matplotlib.pyplot as plt
 from sklearn import metrics
 from sklearn.cluster import KMeansimport utilities
# 加载数据
 data = utilities.load_data('data_multivar.txt')
 num_clusters = 4# 画出原始数据
 plt.figure()
 plt.scatter(data[:,0], data[:,1], marker='o', 
         facecolors='none', edgecolors='k', s=30)
 x_min, x_max = min(data[:, 0]) - 1, max(data[:, 0]) + 1
 y_min, y_max = min(data[:, 1]) - 1, max(data[:, 1]) + 1
 plt.title('Input data')
 plt.xlim(x_min, x_max)
 plt.ylim(y_min, y_max)
 plt.xticks(())
 plt.yticks(())# 训练模型
 kmeans = KMeans(init='k-means++', n_clusters=num_clusters, n_init=10)
 kmeans.fit(data)# 步长
 step_size = 0.01# 找到聚合点
 x_min, x_max = min(data[:, 0]) - 1, max(data[:, 0]) + 1
 y_min, y_max = min(data[:, 1]) - 1, max(data[:, 1]) + 1
 x_values, y_values = np.meshgrid(np.arange(x_min, x_max, step_size), np.arange(y_min, y_max, step_size))# 计算预测
 predicted_labels = kmeans.predict(np.c_[x_values.ravel(), y_values.ravel()])# 画出所有结果
 predicted_labels = predicted_labels.reshape(x_values.shape)
 plt.figure()
 plt.clf()
 plt.imshow(predicted_labels, interpolation='nearest',
            extent=(x_values.min(), x_values.max(), y_values.min(), y_values.max()),
            cmap=plt.cm.Paired,
            aspect='auto', origin='lower')plt.scatter(data[:,0], data[:,1], marker='o', 
         facecolors='none', edgecolors='k', s=30)centroids = kmeans.cluster_centers_
 plt.scatter(centroids[:,0], centroids[:,1], marker='o', s=200, linewidths=3,
         color='k', zorder=10, facecolors='black')
 x_min, x_max = min(data[:, 0]) - 1, max(data[:, 0]) + 1
 y_min, y_max = min(data[:, 1]) - 1, max(data[:, 1]) + 1
 plt.title('Centoids and boundaries obtained using KMeans')
 plt.xlim(x_min, x_max)
 plt.ylim(y_min, y_max)
 plt.xticks(())
 plt.yticks(())
 plt.show()

标签:plt,min,max,kmean,values,聚类,np,240717,data
From: https://blog.51cto.com/u_15862653/11888533

相关文章

  • 基于Python的机器学习系列(19):K均值聚类(K-Means Clustering)
    简介        K均值聚类(K-MeansClustering)是一种常用的无监督学习算法,用于将数据样本划分为若干个“簇”,使得同一簇内的数据点彼此相似,而不同簇的数据点之间差异较大。由于K均值不依赖于标签,因此它是一种无监督学习方法。常见的应用包括客户细分、图像分割和数据可视......
  • 【机器学习】聚类算法的基本概念和实例代码以及局部度量学习的概念和实例代码
    引言聚类算法在许多领域都有广泛的应用,例如数据挖掘、生物信息学、图像处理等。文章目录引言一、聚类算法1.1K-Means算法1.2DBSCAN算法1.3层次聚类(HierarchicalClustering)算法1.4高斯混合模型(GaussianMixtureModel,GMM)1.5谱聚类(SpectralClustering)算法1.6基......
  • 亦菲喊你来学机器学习(16) --K-means聚类算法
    文章目录K-means基本步骤优缺点构建模型总结K-meansK-means算法是一种广泛使用的聚类算法,旨在将数据集划分为K个簇,使得每个簇内的数据点尽可能相似,而不同簇之间的数据点尽可能不同。这个算法通过迭代的方式实现,每次迭代都会更新簇的中心(即簇内所有点的均值),然后将......
  • TPAMI 2024 | 离散且平衡的谱聚类算法:一种可扩展的方法
    DiscreteandBalancedSpectralClusteringWithScalability离散且平衡的谱聚类算法:一种可扩展的方法RongWang,HuiminChen,YihangLu,QianrongZhang,FeipingNie,andXuelongLi摘要谱聚类(SC)因其卓越的聚类性能而成为深入研究的主要课题。尽管取得了成功......
  • 《机器学习》—— K-means 聚类算法
    文章目录一、什么是K-means聚类算法?二、聚类效果评价方式——轮廓系数三、示例:代码实现四、聚类算法的优缺点一、什么是K-means聚类算法?K-Means是Python中非常流行的一个聚类算法,它属于无监督学习算法的一种。在scikit-learn(一个广泛使用的机器学习库)中,KMeans......
  • 层次聚类算法原理及Python实现
    层次聚类算法(HierarchicalClusteringMethod)是一种基于簇间相似度在不同层次上分析数据,从而形成树形聚类结构的算法。它主要分为两种形式:凝聚层次聚类(自下而上)和分裂层次聚类(自上而下)。以下将详细介绍凝聚层次聚类的原理与步骤:一、原理凝聚层次聚类算法的基本思想是将每个样......
  • 谱聚类算法原理及Python实现
    谱聚类算法(SpectralClustering)是一种基于图论的聚类算法,其原理与步骤可以详细阐述如下:一、原理谱聚类算法建立在谱图理论基础上,它将聚类问题转化为图的最优划分问题。具体来说,算法将数据集中的每个对象看作是图的顶点V,将顶点间的相似度量化作为相应顶点连接边E的权值,从而得......
  • Python之层次聚类/系统聚类(Hierarchical Clustering)、变量聚类
    1.层次聚类简介别称:系统聚类英文名:HierarchicalClustering基本原理:假设数据类别之间存在层次结构,通过对数据集在不同层次的划分,构造出树状结构的聚类结果实现方法:聚合方法、分裂方法实现方法方向步骤描述经典算法聚合方法自底向上首先,每个样本自成一簇;然后,开始迭代,每......
  • 使用贝叶斯优化CDENCLUE聚类算法参数
    目录1.贝叶斯优化的基本原理原理和实现步骤:2.轮廓系数的原理公式:3.贝叶斯优化的实现流程(伪代码)1.贝叶斯优化的基本原理贝叶斯优化是一种基于概率模型的优化方法,主要用于优化计算代价高昂的黑盒函数。它结合了先验知识和观察到的数据来更新后验知识,并用一个易......
  • 蒙特卡洛1000个风光场景并通过削减法|聚类法得到几个典型场景(matlab&python实现)
        目录1 对风光的认识2 风电DG出力概率模型 2.1 风速分布特性2.2 风电DG有功出力3 光伏DG出力概率模型 3.1 光照强度分布特性3.2光伏DG有功出力 4Python代码实现4.1数据4.2Python代码 4.3结果  5Matlab实现5.1数据5.2Matlab代码 5.......