K-medoids算法是一种经典的聚类算法,与K-means类似,都是基于划分的方法。然而,K-medoids通过选择数据中的实际数据点作为簇的中心点,在对抗异常值和噪声方面表现出色。本文将介绍k-medoids算法的实现,包括 PAM(Partitioning Around Medoids)和CLARA(Clustering LARge Applications)方法。
一、认识Pam聚类
聚类分析(Clustering Analysis)是一种数据挖掘技术,目的是将数据对象划分为多个簇,使得同一簇内的对象具有较大的相似性,而不同簇的对象之间具有较大的差异性。聚类算法广泛应用于医学、市场细分、图像处理、文本分析等领域。
常见的聚类方法包括:
- 基于划分的聚类,如k-means、k-means++、Pam聚类;
- 基于层次的聚类,如凝聚层次聚类、分裂层次聚类;
- 基于密度的聚类,如DBSCAN;
- 基于网格的聚类,如STING。
聚类方法 | 算法简介 |
---|