首页 > 数据库 >数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验

时间:2024-01-24 17:05:12浏览次数:41  
标签:点选 变量 步骤 Excel 时序 聚类 挖掘 选取

1.实验要求 

利用SQL Server 2012或者Excel 2013(二者选择其一即可)进行数据挖掘实验,采用聚类和时序挖掘模型和算法,可以对附件中给定的excel数据进行聚类和时序挖掘实验,也可以采用自己采集的数据(如采用自选请说明数据来源)。

 

2.实验环境 

操作系统:windows 11;

软件:Excel 2019;SQL Server 2012;SQL Server 2012 Analysis Services;Microsoft Visual Studio 2010;

 

3.实验步骤

3.1 Excel 2019 聚类与时序挖掘

(一)聚类分析

【步骤一】数据源为 Microsoft内建数据集

为2002至2013年自行车购买的数据集

(Table Analysis Tools Sample),建立聚类模型,点选“数据建模”下的“聚类分析”,开始建立数据挖掘模型,点选“下一步”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012

图 1

【步骤二】在“选取源数据”的界面,数据表下选取Excel中欲分析的数据表。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_02

图 2 

【步骤三】在选取数据列的步骤时,勾选纳入聚类的变量,由于ID是为客户编码,所以本次分析不将它纳入聚类变量,接着点选‘下一步”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_03

图 3

【步骤四】选取聚类变量后,在区段数目选取聚类个数,可以使用软件自动侦测,或是自行指定目标值,本次分析指定目标值为5群,点选“下一步”。

 

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_04

图 4

【步骤五】将数据分割成定型集和测试集,要测试的数据百分比默认为30%。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_05

图 5

【步骤六】院成数据挖掘模型,选项中可以勾选“启用钻取”,接着点选完成钮。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_06

图 6

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_07

图 7

【步骤七】产生5个类的聚类图表,若欲将图形复制至Excel接口下操作,可以点选方块左下角“复制至Excel”键。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_08

图 8

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_09

图 9

【步骤九】点选“分类剖面图”,显示各个群体在不同变量下的差异。将图形复制至Excel接口下,点选方块左下角“复制至Excel”键。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_10

图 10

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_11

图 11

单击age变量“总体”类别下的对应图形,在右侧的挖掘图例中可以看到总体类别下age变量的总体特征值,包括最小值25,最大值78.25,平均值44等等。同样地,也可查看age变量在其他分类下的特征数值,或者其他变量在各个分类下的特征数值。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_12

图 12

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_13

图 13

【步骤十一】点选“分类特征”,显示各聚类在不同变量的水平下,分类为此群组的概率值。“分类特征”一目了然地显示了各个变量各取值在各个分类下的占比。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_14

图 14

【步骤十二】图表复制至Excel窗体。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_15

图 15

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_16

图 16

将图表复制至Excel后,可以查看具体的占比数值,如上图所示,总体中, “有房否”变量取值为“有”的样本占比为66%,同样地,可查看其他变量相应取值在总体中的占比,也可查看各个变量在其他类别下的相应占比。

 

【步骤十三】点选“分类对比”,可以在图形上方选取欲比较的两聚类,利用变量水平比较两聚类的差异。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_17

图 17

【步骤十四】图表复制至Excel窗体。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_18

图 18 

【步骤十五】同样的,点选“数据建模”下的“高级”,开始建立数据挖掘模型,点选“下一步”,读取数据表,将数据分割成定型集和测试集,最后建立table2的结构模型。

 

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_19

图 19

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_20

图 20

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_21

图 21

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_22

图 22

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_23

图 23

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_24

图 24

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_25

图 25

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_26

图 26

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_27

图 27

【步骤十六】在选取挖掘算法的步骤,点选“Microsoft聚类分析”,点选“下一步”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_28

图 28

【步骤十七】在选取数据列的步骤时,在各个变量后方有一栏是“用法”选取,用户可以选取各个变量的使用方式,包含输人、仅预测输入和预测、key 以及不使用等等,本次用是否购买自行车(Purchased Bike)作为预测变量¥,其余变量作为解释变量建立模型,接着点选“下一步”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_29

图 29

【步骤十八】

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_30

图 30

【步骤十九】

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_31

图 31

【步骤二十】点击“准确性图表”标签。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_32

图 32

【步骤二十一】在[指定要预测的列和要预测的值]的对话框中,选取进行预测的数据列,本次选取“Purchased Bike”=“No”作为预测值纳入图表。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_33

图 33

【步骤二十二】在[指定关系]的对话框中,选取变量间关联性。

【步骤二十三产生图表到Excel中。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_34

图 34

【步骤二十四】点选“分类矩阵”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_35

图 35

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_36

图 36

【步骤二十五】在“指定要预测的列”方框当中,选择预测的数据列,即自行车购买作为分析变量。勾选“以百分比显示结果”和“以计数显示结果”,生成两种方式显示的两个分类图。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_37

图 37

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_38

图 38

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_39

图 39


数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_40

图 40

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_41

图 41

 

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_42

图 42

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_43

图 43

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_44

图 44

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_45

图 45

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_46

图 46


3.2 时序聚类

【步骤一】点选“高级”→“创建挖掘模型”。

【步骤二】点选“下一步”。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_47

图 47

【步骤三】选择数据表。

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_48

图 48

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_49

图 49

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_SQL Server 2012_50

图 50

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_51

图 51

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_聚类_52

图 52

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_53

图 53

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_53

图 54

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据挖掘_55

图 55

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_56

图 56

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_57

图 57

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_58

图 58

 

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_数据_59

图 59

数据挖掘||利用SQL Server 2012或者Excel 2013采用聚类和时序挖掘模型和算法,对自行车购买的数据集进行聚类和时序挖掘实验_时序聚类_60

图 60

4.实验总结

本次实验分为两大大部分:聚类挖掘、时序挖掘。

使用EXCEL 2019中数据挖掘插件中的先进行数据挖掘,运用准确性图表、分类矩阵、利润来进行 数据挖掘和分析。

标签:点选,变量,步骤,Excel,时序,聚类,挖掘,选取
From: https://blog.51cto.com/u_16532251/9399998

相关文章

  • https://github.com/runze1223/VH-NBEATS 时序数据NBEATS
    https://github.com/runze1223/VH-NBEATS http://ise.thss.tsinghua.edu.cn/~mlong/doc/TimesNet-iclr23.pdf  https://www.xjx100.cn/news/6779.html  https://blog.csdn.net/qq_59482564/article/details/134912580 https://blog.csdn.net/qq_59482564/arti......
  • 聚类算法笔记【零基础数模系列】
    聚类算法前言作为数模小白,看了很多讲解新概念新模型的文章,这些文章往往要么讲的很浅不讲原理只讲应用,让人知其然不知其所以然。要么讲的很深小白看不懂,同时总是忽略关键部分,经常性引入陌生概念让初学者疑惑,因此有了本文,任何能熟练掌握线性代数知识且逻辑思维能力尚可的人都可以......
  • Verdi信号平移+研发管理体系+malloc和calloc函数区别+使用__FILE__只打印文件名+使用i
    Verdi信号平移信号左移是将光标移动在双引号以内的信号名左边,然后先输入数字,可以带上单位,如[ns|n]、[ps|p],然后按<<-按键。https://blog.csdn.net/qq_40268672/article/details/132915499信号右移信号右移是数字在右边,信号在左边,用右移符号,其它不变。研发管理体系https://......
  • 【scikit-learn基础】--『监督学习』之 空间聚类
    空间聚类算法是数据挖掘和机器学习领域中的一种重要技术。本篇介绍的基于密度的空间聚类算法的概念可以追溯到1990年代初期。随着数据量的增长和数据维度的增加,基于密度的算法逐渐引起了研究者的关注。其中,DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是......
  • 论文翻译 | 【深入挖掘Java技术】「底层原理专题」深入分析一下并发编程之父Doug Lea
    前提介绍DougLea在州立大学奥斯威戈分校(DougLea)摘要本文深入探讨了一个Java框架的设计、实现及其性能。该框架遵循并行编程的理念,通过递归方式将问题分解为多个子任务,并利用工作窃取技术进行并行处理。所有子任务完成后,其结果被整合以形成完整的并行程序。在总体设计上,该框架借鉴......
  • 【深入挖掘Java技术】「源码原理体系」盲点问题解析之HashMap工作原理全揭秘(下)
    承接上文在阅读了上篇文章《【深入挖掘Java技术】「源码原理体系」盲点问题解析之HashMap工作原理全揭秘(上)》之后,相信您对HashMap的基本原理和基础结构已经有了初步的认识。接下来,我们将进一步深入探索HashMap的源码,揭示其深层次的技术细节。通过这次解析,您将更深入地理解HashMap的......
  • 【scikit-learn基础】--『监督学习』之 谱聚类
    谱聚类算法基于图论,它的起源可以追溯到早期的图分割文献。不过,直至近年来,受益于计算机计算能力的提升,谱聚类算法才得到了广泛的研究和关注。谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类等领域。例如,在图像分割中,谱聚类可以有效地将图像划分为背景和前景;在社交......
  • 【深入挖掘Java技术】「源码原理体系」盲点问题解析之HashMap工作原理全揭秘(上)
    知识盲点概念介绍HashMap是基于Map接口构建的数据结构,它以键值对的形式存储元素,允许键和值都为null。由于键的唯一性,HashMap中只能有一个键为null。HashMap的特点是元素的无序性和不重复性。注意,HashMap并不是线程安全的。在多线程环境下,如果不进行适当的同步处理,可能会导致数据不......
  • R语言SVM模型文本挖掘分类研究手机评论数据词云可视化
    随着大数据时代的来临,数据挖掘和机器学习在诸多领域中的应用价值日益凸显。手机评论数据作为消费者对产品和服务的主观反馈,具有巨大的商业价值。本文旨在帮助客户通过R语言实现支持向量机(SVM)模型在文本挖掘分类方面的研究,并对手机评论数据进行词云可视化分析,以深入挖掘消费者意见,为......
  • R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化
    原文链接:http://tecdat.cn/?p=22732 原文出处:拓端数据部落公众号 关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中,我将解释如何在R中提取关联规则。关联规则模型适用于交易数据。交易数据的一个例子可以......