首页 > 其他分享 >SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘|附代码数据

SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘|附代码数据

时间:2023-10-31 21:22:17浏览次数:45  
标签:MEANS Apriori 签收 SPSS 聚类 物流 数据 Modeler

全文链接:http://tecdat.cn/?p=32633

原文出处:拓端数据部落公众号

物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。

SPSS Modeler是一款功能强大、界面友好的数据挖掘和分析工具,可以帮助企业对物流发货明细数据进行深入和准确的挖掘分析,提高数据价值和运营效率。

本文将以SPSS Modeler帮助客户分析物流发货明细数据,介绍如何使用SPSS Modeler对物流发货明细数据进行聚类分析和关联规则挖掘,并分析得出有益的结论和建议,为企业的物流运营和发展提供参考与支持。

数据的预处理

本研究的数据是一组关于物流的发货明细,数据包括以下字段:项目、指令日期、始发省、始发市、目的省、目的市、收货人单位、品名、数量、签收时间、签收数量、拒收数量和拒收原因。

image.png

对数据进行预处理:

(1)补充缺失值。对没有记录的数据缺失采用平均值法,以该字段的平均分数填充。

(2)规范化数据。运用最小-最大规范化方法对数据进行规范化处理,将数据映射到[0,1]区间,计算公式如下。

image.png

其中:ymax为该字段的最大值;

      ymin为该字段的最小值。

过程及结果分析

(1)读取数据

选择SPSS Modeler的Source-Excel-Data,在Data选项页中通过Import Files输入框选定Excel格式的成绩表文件,并点击Read Values 按钮,将所有数据读入,如图所示。

(2)K-Means 模型设置

选择SPSS Modeler的Modeling-K-means,将K-Means模型节点添加进数据流来,双击K-Means图标,在弹出的对话框中选择Model选项页,选项页中的参数解释如下:

1)Numbers of cluster:制定生成的聚类数目,这里设置为3.

2)Use Partitioned Data:如果用户定义了分割数据集,选择训练数据集作为建模数据集,并利用测试数据集对模型进行评价。

继续选择对话框中的Expert选项页,如图所示,对该选项页中的参数做一下设置:

Model选项:选择Expert模式,表示将进行高级模式的选择。

Stop on选项:选择custom选项修改迭代终止的条件:

1)Maximum iterations(最大迭代数):该选项允许在迭代制定次数后终止训练,这里设置为20.

2)Change tolerance(差异容忍度):该选项允许在一次迭代中质心之间的最大差异小于制定水平时终止训练。

image.png

(3)执行和输出

设置完成后,选中Execute 按钮,即可得到执行并观察到结果。点击VIEW选项卡,可以以图表的形式来显示模型的统计信息以及各个属性在各簇中的分布信息。

1111.png

(4)聚类结果

结果表明:簇1和2中的签收数量较低,簇5中的签收数量一般,簇4中的签收数量最低,可见,大部分样本的签收数量处于中等水平;各变量在各簇中的显著程度均较大,表明不同聚类簇的签收数量的分化程度较高,差异显著。

簇1

image.png

簇2

image.png

簇3

image.png

簇4

image.png

簇5

image.png

从每个聚类簇的情况来看,签收数量最多的是第5个簇,该簇中的最多的始发地是广东深圳,签收数量达到了2833件,其次是上海,签收数量达到了1287。同时从结果可以看到四川成都的签收数量最低,说明物流的集中地集中在广东深圳上海等地。

 关联规则挖掘

本文分别用Apriori算法对数据进行处理挖掘,具体结果如下所示。

(1)Apriori算法

 虽然 Apriori 算法可以直接挖掘生成表中的交易数据集,但是为了关联挖掘其他算法的需要先把交易数据集转换成分析数据集,构建的数据流如图所示。

image.png

 1 商品关联规则 Apriori 算法挖掘流图

通过格式转换,发现数据源中共有二十种商品,设最低条件支持度为15%,最小规则置信度为30%,最大前项数为5,选择专家模式,挖掘出大类商品的15条关联规则,如图所示。生成的38条规则如下所示:

image.png

分析及建议: 通过图可以清晰的看到深圳、广东、北京的物流订单比较多,建议物流企业可以加大对这些地区的工作人员安排,由上述结果可知,发往北京和发往广东深圳的物流运单分别占总运单数的51.515%,41.414%,由此可见,北京 山东  深圳三个目的地的关联度较高,可以将这些地点的仓库摆放在一块,从而增加效率。同时可以看到 发往北京的物品中出现了较多的 三星 SM-W2016商品。因此,可以将这些商品交由专人来负责来提高效率。

最后我们得到了以下结果和文件:

image.png


QQ截图20220925234816.png

最受欢迎的见解

1.R语言k-Shape算法股票价格时间序列聚类

2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图

3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的层次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本挖掘聚类

7.R语言KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化

8.PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

标签:MEANS,Apriori,签收,SPSS,聚类,物流,数据,Modeler
From: https://www.cnblogs.com/tecdat/p/17801573.html

相关文章

  • SPSS 25 汉化版下载「IBM spss statistics」中文一键安装
    SPSS是一款非常专业的数据统计分析软件。它的功能十分强大,集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体,提供描述性统计、数据准备、绘图、二元统计过程、因子和聚类分析以及线性和顺序回归等实用功能。软件地址:看置顶贴软件特点:1、操作简单它的界面很友好,......
  • R语言改进的K-Means(K-均值)聚类算法分析股票盈利能力和可视化|附代码数据
    全文链接:http://tecdat.cn/?p=32418原文出处:拓端数据部落公众号大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。人们在投资时总期望以最小的风险获取最大的利益,面对庞大的股票市场和繁杂的股票数据,要想对股票进行合理......
  • 据类方法之:KMeans聚类分析
    书接上回,在上一篇博客中完成了数据的降维分析,这里在降维后的基础上继续进行聚类分析,使用前2个PC进行KMeans据类并可视化。fromsklearn.clusterimportKMeansfromcollectionsimportCounter#语言定义颜色和画布colors=['b','g','r','y','k','c','m�......
  • 数据分享|MATLAB、R基于Copula方法和k-means聚类的股票选择研究上证A股数据|附代码数
    全文链接:http://tecdat.cn/?p=31733最近我们被客户要求撰写关于Copula的研究报告,包括一些图形和统计输出。Copula方法是测度金融市场间尾部相关性比较有效的方法,而且可用于研究非正态、非线性以及尾部非对称等较复杂的相依特征关系因此,Copula方法开始逐渐代替多元GARCH模型的相......
  • sklearn KMeans包结果无法复现
    随机问题numpy等随机数使用numpy等随机数时,一定要注意随机函数会首到上次随机结果的影响。e.g.#如果代码如下:importnumpyasnpnp.random.seed(20)#为numpy设置随机种子foriinrange(10):x=np.random.random()print(x)会发现每次随机的结果不一致,这是......
  • 基于weka的数据库挖掘➖聚类方法K-Means算法
    基于weka的数据库挖掘➖聚类方法K-Means算法目标1.掌握k-Means算法的原理和聚类过程2.可以使用k-Means算法实现对给定样本集的聚类。内容1.采用k-Means算法,对给出的15个样本数据进行聚类,聚类簇数可自由调整,最后输出簇数为2、3、5的聚类结果。k-Means初识k-Means算法是一种......
  • R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化|附代码数据
    全文链接:http://tecdat.cn/?p=32307原文出处:拓端数据部落公众号互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个尝试。文本聚类其实也就......
  • 数据分享|MATLAB、R基于Copula方法和k-means聚类的股票选择研究上证A股数据|附代码数
    全文链接:http://tecdat.cn/?p=31733最近我们被客户要求撰写关于Copula的研究报告,包括一些图形和统计输出。Copula方法是测度金融市场间尾部相关性比较有效的方法,而且可用于研究非正态、非线性以及尾部非对称等较复杂的相依特征关系因此,Copula方法开始逐渐代替多元GARCH模型的相......
  • 空间密度算法DBSCAN和K-means聚类算法有什么区别和联系
    DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)和K-means是两种常见的聚类算法,它们有一些区别和联系。区别:原理:K-means是基于距离的划分聚类算法,通过最小化数据点与聚类中心之间的平方误差来进行聚类。DBSCAN是基于密度的聚类算法,通过将密度相连接的数据......
  • OpenCV3.2图像分割 实例9:K-Means-证件照背景替换
    1#include<opencv2/opencv.hpp>2#include<iostream>34usingnamespacecv;5usingnamespacestd;67Matmat_to_samples(Mat&image);8intmain(intargc,char**argv){9Matsrc=imread("tx.png");......