首页 > 其他分享 >SPSS modeler用关联规则Apriori模型对笔记本电脑购买事务销量数据研究

SPSS modeler用关联规则Apriori模型对笔记本电脑购买事务销量数据研究

时间:2023-12-28 21:55:31浏览次数:28  
标签:15.6 英寸 Apriori 宏碁 SPSS 4GB Acer modeler

全文链接:https://tecdat.cn/?p=34709

原文出处:拓端数据部落公众号

自2011年全球PC出货量达到历史最高的3.64亿台后,全球PC市场出货量已经连续四年下滑。市场调研公司Gartner最新数据显示,2015年Q3全球PC销量同比降低7.7%,至7370万台。IDC数据更加不乐观,2015年Q3全球PC出货量共计7100万台,同比下降10.8%,相比之前预测的下滑9.2%更夸张。其中,中国市场下滑幅度预计在6%左右。本次调查就是针对笔记本电脑销量运用数据挖掘的方式展开讨论。

研究数据及范围

本研究以统计学原理为基础,通过网上收集已有的数据并调查,采用数据挖掘技术以及描述性的统计方法,对笔记本电脑销量问题进行研究,分析什么影响群众购买笔记本电脑情况?

本次数据是在数据网站搜集到的spss类型的数据,共有13个变量,5000多份数据资料,没有系统缺失值。其中5个定距变量,8个定类变量:

image.png

研究目的:

1、寻找影响笔记本电脑销量的主要因素。

2、建立基于数据挖掘技术的有关笔记本电脑销量预测模型。

研究方法

运用数据挖掘clemtime描述性分析,推断性分析,和建模分析

分析过程

1.数据导入与异常值和离群值的处理

image.png

我们可以看见数据存在离群值和异常值,对于离群值,我采用coerce,即用距离离群值最近的正常值代替它们。对于极端值采用discard extremes,即剔除极端值。

基本描述分析

通过clmtime描述性分析并作图,

销售价格与月成交量的基本关系:散点图,

image.png

价格越贵成交量越少,价格越便宜销售量就相对多。

月成交量与电脑屏幕尺寸的基本关系:散点堆积图

image.png

从图中可以看出,销售量峰值在15.6英寸到13英寸之间。

image.png

从图中可以看出散点集中在部分品牌,如联想,苹果,戴尔等;

模型简介

    关联规则是数据挖掘算法中主要技术之一,是在无指导学习系统中挖掘本地模式的最普遍形式。在数据挖掘中,常见的关联规则挖掘模型有AIS、SETM、Apriori、DHP、MLT2L1、ML-TML1等。其中,Apriori算法是一种最有影响的挖掘关联规则频繁项集的模型。

Apriori模型原理

    Apriori算法通过多次扫描事务数据库来产生频繁项目集,我们称这种方法为逐层搜索迭代法。具体地说,该算法的基本思想是通过对数据库的多次扫描来发现所有的频繁项集。首先第1遍扫描事务数据库生成频繁1项集,记为L1;然后基于L1第2遍扫描事务数据库生成频繁2项集,记为L2;依此迭代,基于L(k-1)第k遍扫描事务数据库生成频繁k项集,记为Lk。在后续的扫描中,首先以前一次所发现的所有频繁项集为基础,生成所有新的候选项集(Candidate Item sets),然后扫描数据库,计算这些候选项集的支持度,最后确定候选项集中哪些可成为频繁项集。重复上述过程直到再也产生不出新的频繁项集。

image.png

仿真

平台及数据

为了验证Apriori模型在DSS数据挖掘中应用的可行性,本文在SPSS modeler软件平台上对Apriori模型进行仿真。实验数据来自于某电商网站的DSS系统中的顾客及购买电脑数据。数据包括1277条购买事务记录,每条购买事务记录中包含内容:价格、月成交量、累计评价、人气、产品名称、能效等级、品牌、屏幕尺寸、显存容量、机械硬盘容量、内存容量等。本文结合Apriori模型分析DSS中的顾客信息及购买数据分析哪些特征电脑最有可能购买。

价格 月成交量 累计评价 人气 产品名称 能效等级 品牌 屏幕尺寸 显存容量 机械硬盘容量 内存容量
3299 205 1353 4099 Acer/宏碁 E5 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
3299 205 1353 4099 Acer/宏碁 E5 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
3609 183 2149 14134 Acer/宏碁 E15 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
3609 183 2149 14134 Acer/宏碁 E15 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
3609 183 2149 14134 Acer/宏碁 E15 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
3609 183 2149 14134 Acer/宏碁 E15 E5-572G-... 一级 Acer/宏碁 15.6英寸 2GB 500GB 4GB
...                    
4709 88 195 1409 Acer/宏碁 威武 V5-591G 一级 Acer/宏碁 15.6英寸 2GB 1TB 8GB
4709 88 195 1409 Acer/宏碁 威武 V5-591G 一级 Acer/宏碁 15.6英寸 2GB 1TB 8GB
4709 88 195 1409 Acer/宏碁 威武 V5-591G 一级 Acer/宏碁 15.6英寸 2GB 1TB 8GB
4400 88 159 4365 Acer/宏碁 Aspire F15 F5... 一级 Acer/宏碁 15.6英寸 4GB 1TB 8GB
7588 85 445 2492 Apple/苹果 MacBook Air ... Apple/苹果 13.3英寸 共享内存容量 无机械硬盘 4GB
7588 85 445 2492 Apple/苹果 MacBook Air ... Apple/苹果 13.3英寸 共享内存容量 无机械硬盘 4GB

实验结果及分析

本文分别用Apriori算法对数据进行处理挖掘,具体结果如下所示。

Apriori算法

 虽然 Apriori 算法可以直接挖掘生成表中的交易数据集,但是为了关联挖掘其他算法的需要先把交易数据集转换成分析数据集,构建的数据流如图 1 所示。

QQ截图20231128144503.png

通过格式转换,发现数据源中共有二十种电脑,设最低条件支持度为15%,最小规则置信度为30%,最大前项数为5,选择专家模式,挖掘出大类电脑的13条关联规则,如图 2 所示。生成的13条规则如下所示:

image.png

从实验结果来看,实验产生了三条置信度和支持度最高的关联规则:分别为能效等级 = 一级,品牌 = Lenovo/联想,支持度=19.27899686,置信度=97.5609756097561;m能效等级 = 一级,品牌 = Lenovo/联想 and 内存容量 = 4GB   ,支持度=12.695924764890282  ,置信度=97.53086419753086;能效等级 = 一级,       品牌 = Lenovo/联想 and 显存容量 = 2GB       支持度=13.166144200626958    ,置信度=96.42857142857143。同时,三条关联规则的提升值都可以接受。因此,能效等级、品牌 = Lenovo/联想、内存容量是最可能连带销售的电脑特征。因此,在实际销售或者在电脑的摆放过程中,可以将这些特征的电脑进行捆绑销售。

分析及建议: 通过表 2 可以清晰的看到购买Lenovo/联想、能效等级 = 一级的顾客比较多,建议电商网站可以加大对这些电脑的采购,由上述结果可知,同时购买Lenovo/联想、能效等级 = 一级的顾客的情况占总订单数的19.27%,能效等级 = 一级,品牌 = Lenovo/联想 and 内存容量 = 4GB的订单分别占总订单数的12.69%,购买能效等级 = 一级电脑的人有97.530会购买Lenovo/联想,95%的人会购买华硕,由此可见,能效等级、内存、品牌这三种电脑特征关联度较高,可以将能效等级 = 一级、Lenovo/联想、华硕的电脑摆放在一块,从而增加销量。此外,在符合支持度和置信度的条件下没有顾客购买东芝、清华同方等,建议有关人员减少这几种电脑的进货量,但为了保持电脑的多样性,还是要适当地进货。


what-is-a-cto-cio-1433175581-hero-1536x864.webp 最受欢迎的见解

1.探析大数据期刊文章研究热点

2.618网购数据盘点-剁手族在关注什么

3.r语言文本挖掘tf-idf主题建模,情感分析n-gram建模研究

4.python主题建模可视化lda和t-sne交互式可视化

5.r语言文本挖掘nasa数据网络分析,tf-idf和主题建模

6.python主题lda建模和t-sne可视化

7.Python中的Apriori关联算法市场购物篮分析

8.通过Python中的Apriori算法进行关联规则挖掘

9.python爬虫进行web抓取lda主题语义数据分析

标签:15.6,英寸,Apriori,宏碁,SPSS,4GB,Acer,modeler
From: https://www.cnblogs.com/tecdat/p/17933669.html

相关文章

  • IBM SPSS Statistics 27:洞悉数据,揭示趋势
    IBMSPSSStatistics27是一款功能强大的数据统计分析软件,它可以帮助用户快速、准确地分析和解读数据,并生成高质量的统计图表和报告。点击获取IBMSPSSStatistics27首先,IBMSPSSStatistics27具有广泛的数据分析工具和功能。它支持各种数据导入和预处理方式,可以快速清洗、整......
  • SPSS modeler利用类神经网络对茅台股价涨跌幅度进行预测
    全文链接:https://tecdat.cn/?p=34459原文出处:拓端数据部落公众号分析师:XuZhang数据变得越来越重要,其核心应用“预测”也成为各个行业以及产业变革的重要力量。对于股市来说,用人工智能来对股价进行预测成为量化投资的一个重要手段。本项目帮助客户运用powerBI获取网易财经上茅......
  • SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘|附代码数据
    物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。SPSSModeler是一款功能强大、界面友好的数据挖掘和分析工具,......
  • 利用SPSS做多元线性回归
    这里做的是RH(土壤相对湿度)和PA、SPI、MI、MCI之间的关系:   结果: 看下R方,0.221,说明预测变量PA、SPI、MI、MCI能够解释因变量RH22.1%,证明RH的波动只有22.1%是由于PA、SPI、MI、MCI造成的,一般统计学要求30%以上是可以接受的。实际数据达到10%就算好的了,一般10%可以接受......
  • 数据分享|spss modeler用贝叶斯网络分析糯稻品种影响因素数据可视化
    全文链接:https://tecdat.cn/?p=34271原文出处:拓端数据部落公众号在农业科学领域,对糯稻品种的研究一直备受关注。糯稻作为一种重要的粮食作物,其产量和质量均对农业生产具有深远的影响。然而,影响糯稻品种的因素是多元化的,理解这些因素之间的关系以及如何通过数据可视化来呈现这些......
  • 数据分享|WEKA关联规则挖掘Apriori算法在学生就业数据中的应用
    全文链接:https://tecdat.cn/?p=34254原文出处:拓端数据部落公众号关联规则挖掘作为数据挖掘的一个重要分支,对于发现数据之间的潜在关联和规律具有重要意义。在教育领域,学生就业数据是一类重要的数据资源,通过关联规则挖掘可以揭示学生就业相关的规律和影响因素。本文旨在探讨WEKA......
  • The following perl modules required by RepeatModeler are missing from your syste
     001、问题  RepeatModeler编译安装报错如下: 002、尝试逐个安装确实的perl模块;也是各种问题;最后不想折腾,就大力出奇迹,全安装,可一次解决所有报错;(base)[[email protected]]#yum-yinstallperl* 003、编译,测试效果:(base)[root@pc1RepeatMo......
  • SPSS进行2×2卡方检验
    对于以上数据,我们想知道性别男女之间对于regressiontonormoglycemia有无差异,这个时候需要用到卡方检验我们在SPSS中选择分析,然后选择描述分析,最后选择交叉表 接着我们在行中添加性别变量rgender,列中添加变量Regressiontonormoglycemia,如下图所示,并在右边统计选项中选中......
  • SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘|附代码数据
    全文链接:http://tecdat.cn/?p=32633原文出处:拓端数据部落公众号物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决......
  • SPSS 25 汉化版下载「IBM spss statistics」中文一键安装
    SPSS是一款非常专业的数据统计分析软件。它的功能十分强大,集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体,提供描述性统计、数据准备、绘图、二元统计过程、因子和聚类分析以及线性和顺序回归等实用功能。软件地址:看置顶贴软件特点:1、操作简单它的界面很友好,......