首页 > 其他分享 >爱数科案例 | 汽车款式聚类

爱数科案例 | 汽车款式聚类

时间:2022-10-17 15:10:09浏览次数:81  
标签:变量 Means 聚类 案例 款式 爱数科 进行


爱数科平台是一款数据科学科研和教学一体化平台,集成数十行业数千数据集、科研案例模板。帮助科研人员快速使用大数据和人工智能技术开展研究。支持高校开展大数据通识课程教学。帮助非专业人员进行数据分析和生成数据分析报告。



本案例根据每种汽车的参数,利用K-Means聚类算法来进行聚类,识别出相似的汽车。


爱数科案例 | 汽车款式聚类_聚类

1. 读数据表

首先,我们读取原始数据。

爱数科案例 | 汽车款式聚类_数据分析_02

2. Z-Score标准化

对连续变量mpg,displacement,horsepower,weight,acceleration使用Z-score标准化。

爱数科案例 | 汽车款式聚类_大数据_03

爱数科案例 | 汽车款式聚类_数据分析_04

3. 对类别变量进行哑变量编码

对类别变量cylinders,year,origin进行哑变量编码。

爱数科案例 | 汽车款式聚类_聚类_05

4. K-Means聚类

最后我们使用K-Means进行聚类。

爱数科案例 | 汽车款式聚类_聚类_06

5. 柱状图

画出聚类后每个簇样本数的柱状图。


爱数科案例 | 汽车款式聚类_数据分析_07

6. 无监督聚类评估

最后进行模型评估,输出Calinski-Harabasz指数、Davies-Bouldin指数和轮廓系数。

爱数科案例 | 汽车款式聚类_大数据_08



标签:变量,Means,聚类,案例,款式,爱数科,进行
From: https://blog.51cto.com/u_15622928/5762886

相关文章

  • 爱数科案例 | 共享单车使用量影响因素可视化分析
    近些年,“共享单车”模式迅速地在全球各大城市中流行起来,但随着资本的逐步退潮,共享单车企业需寻求新的盈利模式,首要任务便是探究共享单车使用量的影响因素。本案例利用首尔自......
  • 爱数科案例 | 数据预处理——字符串分割
    下载数据集请登录爱数科(www.idatascience.cn)本案例主要用于熟悉数据预处理中字符串分割组件的操作和运用。1. FordGoBike共享单车数据集首先,读取数据集FordGoBike共享......
  • DBSCAN具有噪声的基于密度的聚类方法
     简介聚类:将原始数据分类(数据集->聚类算法->数据分组)目的:希望将数据根据特征的密度找相似性,分为指定或者若干数据组使用场景:简单的如将同颜色的球分类,或......
  • 蚁群聚类算法
    1.问题描述:2.部分程序:clc;clf;clear;%X=测试样本矩阵;X1=load('data.txt');X=X1(:,1:2);[N,n]=size(X);%N=测试样本数;n=测试样本的属性数;K=4;......
  • 模糊聚类的matlab仿真
    1.问题描述: 模糊聚类分析是一种采用​​模糊数学​​​语言对事物按一定的要求进行描述和分类的数学方法。 [1]  模糊聚类分析一般是指根据研究对象本身的属性来构造​......
  • HTML+CSS+JS生日祝福网页在线制作(多种款式)
    ......
  • Kmeans聚类算法详解
    摘要:本文详细介绍Kmeans聚类算法的原理和程序实现。首先介绍利用该算法的原理及理解,详细介绍基于MATLAB设计一个自定义的Kmeans函数过程,然后利用该函数对UCI的数据集进行聚......
  • 聚类算法中聚类数量的确定方法
    聚类算法中聚类数量的确定方法聚类算法是对实体进行分组归类的有效方法,也是有利于降低人力工作量的有效手段,例如先用AI聚类方法对实体数据进行聚类分组,再由人工介入指认,能......
  • 机器学习——聚类(K-Means)
    机器学习——聚类(K-Means)那是什么无监督学习——聚类聚类是基于相似对象将一组对象分组为类/类别的过程。聚类是一部分无监督学习.这种方法通常用于确定业务决策,特......
  • 基于密度的聚类如何工作(数据挖掘)
    基于密度的聚类如何工作(数据挖掘)PhotobyGanapathyKumaron不飞溅SSDBCODI:集成了异常值检测的半监督密度聚类(arXiv)作者:JiahaoDeng,伊莱·T·布朗抽象......