首页 > 编程语言 >常见聚类算法

常见聚类算法

时间:2023-02-26 17:55:06浏览次数:39  
标签:期望 最大 常见 估计值 算法 计算 聚类

聚类算法

KMeans

Kmeans算法,也被称为K-平均或K-均值,是一种得到最广泛使用的聚类算法,主要思想是:首先将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,然后把每个数据点划分到最近的类别中,使得评价聚类性能的准则函数达到最优,从而使同一个类中的对象相似度比较高,而不同类之间的对象的相似度较小

算法优点:理论清晰,算法简单,算法收敛速度很快,仅需20次以内的迭代就能得出最终聚类结果,适用于发现球形聚类簇

算法缺点:算法结果依赖初始中心的选取,如果算法初值选取不当,会陷入局部最优解,不能发现非球形聚类簇,不能发现差别很大的类,对噪声和孤立点很敏感

EM

最大期望算法是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量。最大期望经常用在机器学习和计算机视觉数据聚类领域,最大期望算法经过两个步骤交替计算,第一步是计算期望,利用对隐藏变量的现有估计值,计算最大似然估计值,第二步最大化,最大化在计算期望上求得的最大似然值计算参数的值,最大化上找的参数估计值被用于下一个计算期望的步骤中,两个步骤交替进行。

算法优点:最大期望算法计算结构稳定,准确,算法可以给出每一类样本被分配到每一个类的概率,丰富的信息量要比简单的结果好的多,可以把这个结果转化为一个得分,表示模型对结果的把握,最后我们选取把握最大的模型

算法缺点:计算复杂收敛较慢,不适合大规模数据和高维数据,在迭代中如果某类样本特别少会导致协方差矩阵奇异,容易陷入局部最优,对孤立点敏感,有噪音效果差

标签:期望,最大,常见,估计值,算法,计算,聚类
From: https://www.cnblogs.com/tgfoven/p/17157183.html

相关文章