首页 > 编程语言 >【机器学习算法基础】(基础机器学习课程)-11-k-means-笔记

【机器学习算法基础】(基础机器学习课程)-11-k-means-笔记

时间:2024-08-04 16:27:03浏览次数:17  
标签:11 10 20 means 30 70 机器 100 80

 

 

 

 

示例案例

为了更好地理解 K-Means 算法,下面通过一个简单的案例进行说明。

假设我们有以下 10 个二维数据点,表示不同商店的销售额(单位:千元)和顾客数(单位:人):

[(10, 100), (20, 80), (30, 70), (40, 60), (50, 50), (60, 40), (70, 30), (80, 20), (90, 10), (100, 5)]

我们希望将这些商店分成 2 个簇(K=2)。

  1. 选择 K 值:K=2。

  2. 初始化簇中心:随机选择两个初始簇中心。假设我们选择 (10, 100) 和 (100, 5)。

  3. 分配数据点

    • 计算每个数据点到 (10, 100) 和 (100, 5) 的距离。
    • 将每个数据点分配给最近的簇中心。
    • 例如,(10, 100) 距离 (10, 100) 为 0,距离 (100, 5) 为 126.49,所以它属于第一个簇。
  4. 更新簇中心

    • 计算每个簇的新中心。
    • 例如,假设第一个簇包含 (10, 100), (20, 80), (30, 70),新中心是这三个点的均值:(20, 83.33)。
  5. 重复分配数据点和更新簇中心

    • 不断重复上面的步骤,直到簇中心不再变化。

最终,我们可能得到如下两个簇:

  • 簇1:[(10, 100), (20, 80), (30, 70), (40, 60), (50, 50)]
  • 簇2:[(60, 40), (70, 30), (80, 20), (90, 10), (100, 5)]

每个簇中心分别为 (30, 72) 和 (80, 21)。

K-Means 的优点和缺点

优点

  • 简单且易于实现。
  • 计算速度快,适用于大规模数据集。
  • 聚类结果易于解释。

缺点

  • 需要事先指定簇的数量 K。
  • 对初始簇中心敏感,不同的初始值可能导致不同的结果。
  • 可能陷入局部最优解。
  • 仅适用于线性可分的数据,对复杂形状的簇效果不佳。

总结

K-Means 聚类算法通过迭代地分配数据点和更新簇中心,将数据集划分成 K 个簇。尽管有一些局限性,但由于其简单性和高效性,K-Means 广泛应用于各种聚类任务。

标签:11,10,20,means,30,70,机器,100,80
From: https://blog.csdn.net/g1997c/article/details/140906493

相关文章

  • 买二手NVIDIA网卡被坑记录:某宝的咸鱼二手交易网站上购入NVIDIA Mellanox ConnectX-3
    原本是打算去大连的人工智能计算中心去做技术负责人的,不过考虑到工作性质再考虑到自己的一些现实情况也就放弃了这个职位(比较在大连理工大学的博士学位还没有读下来,还是有所牵挂的)。同时,由于自己已经退出了大连理工的相关实验室以及华为集团和大连化物所的相关工作,因此我也就没有......
  • D37 2-SAT P3007 [USACO11JAN] The Continental Cowngress G
    视频链接:D372-SATP3007[USACO11JAN]TheContinentalCowngressG_哔哩哔哩_bilibili  P3007[USACO11JAN]TheContinentalCowngressG-洛谷|计算机科学教育新生态(luogu.com.cn)//O(n*n)#include<iostream>#include<cstring>#include<algorithm>usin......
  • 百度飞桨paddle提供李宏毅的《机器学习》课程、可以使用免费算力一键运行项目,快来一起
    李宏毅的课程《机器学习》是一门深入浅出、内容丰富的在线课程,由台湾大学李宏毅教授主讲。我正在AIStudio学习『李宏毅课程-机器学习』,还可以使用免费算力一键运行项目,快来一起学习吧。点击进入一、课程概述李宏毅的《机器学习》课程旨在通过生动的讲解和丰富的实例,帮助......
  • windows11系统NVIDIA显卡驱动自动升级导致2070 Super显卡失效 —— 552.22版本自动升
    操作系统Windows11,旧版本显卡驱动是552.22,由于安装的是NVIDIAGeforceExperience后显卡驱动自动升级到560.77版本,然后显卡不再工作。重新安装显卡驱动560.77版本显示window11版本操作系统不支持该版本显卡驱动,所以这说明虽然官网上说这个版本的显卡驱动是支持window11的,而且Ge......
  • Shell文本处理秘籍:掌握这11种工具,让数据处理如虎添翼!
    引言在Linux信息环境,文本数据处理是一项基础而重要的技能。对于广大Linux用户而言,掌握Shell环境下的文本处理工具不仅能提高工作效率,还能在面对复杂数据时游刃有余。本文将介绍,那些在文本处理中不可或缺的11种命令工具,让数据处理技能更上一层楼。目录find:find命令无......
  • 机器学习:Python还是R,哪个更好?
    在机器学习领域,选择合适的编程语言是成功的关键因素之一。Python和R是最受欢迎的两种编程语言,各自具有独特的优势和应用场景。本文将探讨Python和R在机器学习中的优缺点,帮助你决定哪种语言更适合你的需求。一、Python和R概述PythonPython是一种通用的编程语言,以其简洁的语法......
  • 基于IEEE802.11g标准的OFDM信号帧检测matlab仿真
    1.程序功能描述     现有的无线通信信道共享的无线信号识别为将来的软件定义的无线电系统是一个巨大的挑战。在这个项目中,学生将制定IEEE802.11无线信号在AWGN信道,利用MATLAB/Simulink技术来识别。一个完整的发射机模式将开发和实施。在AWGN信道下的性能进行评估。 基......
  • (11-1)基于SLAM的自主路径导航系统:背景介绍+项目介绍
    在本章的内容中,通过具体实例展示了实现一个自主路径导航系统的过程。本项目利用TurtleBot3机器人和ROS框架实现了自主路径规划功能,通过SLAM技术进行实时地图建立和定位,并结合move_base包实现路径规划。用户可以根据需求选择不同的SLAM方法,包括gmapping、cartographer、hector......
  • 使用一个io口同时兼容连接dht11和18b20温度传感器
    一个io口同时兼容dht11和18b20温度传感器,也就是说这个io口设计具有高度灵活性,可以兼容DHT11和18B20两种不同类型的温度传感器(一次只能连接一种温度传感器)。用户可以轻松地在同一个io口上连接不同的传感器,从而实现更广泛的应用。这种设计不仅简化了操作流程,也为未来连接其他传感......
  • 在Windows 11上导入shout模块时缺少dll错误
    经过大量研究,我终于在Windows11上安装了python-shout没有使用msys2/mingw。安装模块的setup.py文件是:#distutilsbuildscript#Toinstallshout-python,run'pythonsetup.pyinstall'fromsetuptoolsimportsetup,Extensionimportosimportsysimpo......