首页 > 其他分享 >SPSS Modeler用K-means(K-均值)聚类、CHAID、CART决策树分析31省市土地利用情况和GDP数据

SPSS Modeler用K-means(K-均值)聚类、CHAID、CART决策树分析31省市土地利用情况和GDP数据

时间:2023-06-22 11:15:19浏览次数:51  
标签:GDP 土地利用 means 31 CHAID CART SPSS 聚类 决策树

全文链接:http://tecdat.cn/?p=32840

原文出处:拓端数据部落公众号

随着经济的快速发展和城市化进程的不断推进,土地资源的利用和管理成为了一项极为重要的任务。而对于全国各省市而言,如何合理利用土地资源,通过科学的方法进行规划和管理,是提高土地利用效率的关键。

本文旨在应用SPSS Modeler,帮助客户采用K-means(K-均值)聚类、CHAID、CART决策树等方法,对31个省市的土地利用情况数据进行分析和建模,以期提供科学有效的土地利用规划和管理策略。

31省市土地利用情况数据

image.png

数据流

本文使用的数据来自于国家统计局发布的31省市土地利用情况数据,选取31个省市作为研究对象,并选取了包括草地、耕地、园地、林地、水域和建设用地等7种土地类型的利用情况数据。然后,使用SPSS Modeler进行数据清洗、聚类、决策树等步骤,最终得到模型结果。

image.png

K-means(K-均值)聚类

在对完整的数据集进行初步分析后,本文采用K-means聚类算法对数据集进行聚类分析。在聚类过程中,我们首先需要确定聚类的个数k。根据肘部法则和轮廓系数法则,我们得出最终选择k=5为较为合适的聚类数目。通过SPSS Modeler的K-means节点进行计算,得到了以下聚类概况、聚类类别和散点图结果。

image.png

image.png

image.png

image.png

image.png

image.png

聚类概况

image.png

聚类类别

image.png

通过分类结果我们不难看出,同类省份基本上是相邻省份,或是区域类型(沿海、内陆)相似的省份,对于同类省份,我们可以采取相似的管理制度,使同等级省份得到更好的发展,也可以利用政策方式让高等级省份带动低等级省份发展。

CHAID决策树

在进行完K-means聚类分析后,为了更好地了解各个类别的特征和关系,本文使用CHAID决策树算法对数据集GDP的影响因素进行进一步的分析。首先使用SPSS Modeler的CHAID节点进行计算,得到以下变量重要性和决策树结果。

变量重要性

在CHAID决策树算法中,我们使用卡方值(χ2)来表征每个变量的重要性。具体而言,卡方值越大,则该变量在分类中起到的作用越大。在本文的分析中,最具有代表性的变量是园地、农用地和交通用地比重。

image.png

决策树结果

通过CHAID决策树算法,我们得到了以下的决策树模型。其中每个叶子节点代表一类,而每个内部节点包含了一个决策规则,用于判断不同属性值的记录应该属于哪一个分支。在决策树中房地产用地比重、建设用地比重和城市扩张程度等变量对分类结果有较大的影响。

image.png

image.png

模型误差

为了检验CHAID决策树模型的性能,我们采用随机抽样的方法将数据集分为训练集和测试集,然后利用训练集来训练模型,并使用测试集来验证模型的预测精度。

image.png

CART决策树:

除了使用CHAID决策树算法外,本文还采用了CART决策树算法对数据进行建模。通过SPSS Modeler的C&RT节点进行计算,得到以下变量重要性和决策树结构。  

变量重要性

在CART决策树算法中,我们使用基尼指数(Gini Index)来衡量每个变量的重要性。具体而言,基尼指数越小,则该变量在分类中起到的作用越大。在本文的分析中,最具有代表性的变量是交通、建筑和工矿用地面积。

image.png

决策树结构

通过CART决策树算法,我们得到了以下的决策树模型。在该模型中,每个内部节点代表一个判断规则,而每个叶子节点代表一个分类。最终的分类结果与CHAID决策树模型比较相似,也可提供对土地利用管理的一些启示。

image.png

image.png

模型误差结果:

同样采用随机抽样的方法将数据集分为训练集和测试集,使用训练集训练模型,并使用测试集验证模型预测的准确性。

image.png

结论:

最终我们得到了以下结果文件:

image.png

本文旨在应用SPSS Modeler,采用K-means(K-均值)聚类、CHAID、CART决策树等方法,对31个省市的土地利用情况数据进行分析和建模,并为科学有效的土地利用规划和管理策略提供参考。通过聚类和决策树分析,我们得出以下结论:

1.不同省市的土地利用存在显著差异,按主要利用类型可分为5类;

2.交通、建筑用地面积比重是主要影响土地利用的因素;

3.通过CHAID和CART决策树算法,我们可以较精确地对不同地区的土地利用进行分类,并提出相应的管理建议。

本文的研究结论对于全国土地资源的利用和管理具有一定的参考价值,其方法也可以在其他领域中得到应用和推广。


the-secret-to-great-health-1339038575-thumb-1536x1536.webp

最受欢迎的见解

1.R语言k-Shape算法股票价格时间序列聚类

2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图

3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的层次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本挖掘聚类

7.R语言KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化

8.PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

标签:GDP,土地利用,means,31,CHAID,CART,SPSS,聚类,决策树
From: https://www.cnblogs.com/tecdat/p/17497563.html

相关文章

  • 20230314 3.1. 树
    树的定义树(Tree):n(n≥0)个结点构成的有限集合。当n=0时,称为空树;对于任一棵非空树(n>0),它具备以下性质:树中有一个称为“根(Root)”的特殊结点,用r表示;其余结点可分为m(m>0)个互不相交的有限集T1,T2,...,Tm,其中每个集合本身又是一棵树,称为原来树的“子树(SubTree)”子树是不相交的;......
  • 20230314 3.2. 二叉树
    二叉树的定义二叉树T:一个有穷的结点集合。这个集合可以为空若不为空,则它是由根结点和称为其左子树TL和右子树TR的两个不相交的二叉树组成。二叉树具体五种基本形态:空二叉树;只有根结点的二叉树;只有根结点和左子树TL的二叉树;只有根结点和右子树TR的二叉树;具有根结点、左......
  • 【热门博客文章31】元宇宙与增强现实虚拟现实娱乐:打造全新娱乐方式
    目录引言随着信息技术的不断发展,虚拟现实(VR)和增强现实(AR)技术逐渐成为人们越来越关注的话题。这些技术不仅可以为用户提供全新的娱乐体验,也可以用于游戏、教育、医疗等多个领域。本文将介绍元宇宙与增强现实虚拟现实娱乐的技术原理和实现步骤,并分析其在未来的发展趋势和挑战。......
  • React - 31 redux和react-redux的归纳梳理
    如果使用redux1.把reducer/状态按照模块进行划分和管理;把所有模块的reducer合并为一个即可!!2.每一次任务派发,都会把所有模块的reducer,依次去执行,派发时候传递的行为对象(行为标识)是统一的!!所以我们要保证各个模块之间,派发的行为标识的唯一性!!>派发行为标识的统一管理!!3.需......
  • 最完美WIN11_Pro_22H2.22631.1900软件选装纯净版VIP50.3
    【系统简介】=============================================================1.本次更新母盘来自UUP_WIN11_PRO_22H2.22631.1900。进一步精简优化调整。2.只为呈现最好的作品,手工精简优化部分较多。3.OS版本号为22631.1900。个别要求高的就下MSDN吧,里面啥功能都有。4.集成《DrvCeo......
  • Java面试题集(131-135)
    131、请对以下JavaEE中的名词进行解释答:容器:容器为JavaEE应用程序组件提供了运行时支持。容器提供了一份从底层JavaEEAPI到应用程序组件的联合视图。JavaEE应用程序组件不能直接地与其它JavaEE应用程序组件交互。它们通过容器的协议和方法来达成它们之间以及它们与平台服......
  • 20230313 java.util.LinkedList
    简介java.util.LinkedListLinkedList相对ArrayList要复杂一些,不是因为链表操作比数组操作复杂,而是LinkedList实现了更多接口LinkedList除了实现List接口外,还实现了Queue和Deque接口,也就意味着可以作为队列或双向队列使用对链表的学习非常有帮助感悟对于接口的认......
  • LTV-5314-ASEMI代理光宝IGBT驱动器LTV-5314
    编辑:llLTV-5314-ASEMI代理光宝IGBT驱动器LTV-5314型号:LTV-5314品牌:台湾光宝封装:SOP-5工作温度:-40°C~110°CLTV-5314特性:1.5A最大峰值输出电流1.0A最小峰值输出电流轨对轨输出电压150ns最大传播延迟100ns最大传播延迟差带滞后的欠压锁定保护(UVLO)VCM=1000V时的35kV/us最小共模......
  • LTV-5314-ASEMI代理光宝IGBT驱动器LTV-5314
    编辑:llLTV-5314-ASEMI代理光宝IGBT驱动器LTV-5314型号:LTV-5314品牌:台湾光宝封装:SOP-5工作温度:-40°C~110°CLTV-5314特性:1.5A最大峰值输出电流1.0A最小峰值输出电流轨对轨输出电压150ns最大传播延迟100ns最大传播延迟差带滞后的欠压锁定保护(UVLO)VCM=1000V时的35......
  • 三菱FX3U-485ADP-MB通讯三种变频器程序 已实现测试的变频器:施耐德ATV312,
    三菱FX3U-485ADP-MB通讯三种变频器程序已实现测试的变频器:施耐德ATV312,三菱E700,台达VFD-M三款变频器,支持rtu的协议的变频器都可实现。需要硬件:FX3UPLC,FX3U-485ADP-MB通信扩展模块,施耐德ATV312变频器或台达vfd-m变频器或三菱E700变频器,fx3u-cnv-bd。通过modbusrtu通讯方式,可......