首页 > 其他分享 >SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验

SPSS大学生网络购物行为研究:因子分析、主成分、聚类、交叉表和卡方检验

时间:2024-03-15 21:33:30浏览次数:18  
标签:变量 表和卡方 检验 SPSS 因子 因子分析 聚类 网购

全文链接:https://tecdat.cn/?p=35377

原文出处:拓端数据部落公众号

随着互联网的普及和电子商务的快速发展,网络购物已成为大学生日常生活中不可或缺的一部分。大学生作为网络购物的主体力量,其消费观念、行为特征以及影响因素对于电子商务行业的发展具有重要的研究价值。因此,本文旨在通过问卷调查的方式,帮助客户对大学生网络购物行为进行深入调查与分析,以期为电子商务企业提供有针对性的市场策略建议。

在本次调查中,我们精心设计了问卷,问卷内容涵盖了大学生网络购物的多个方面,包括购物频率、购物平台选择、购物动机、购物满意度等。问卷题型设置上,我们采用了单选题和多选题两种形式,以确保调查结果的全面性和准确性。每个问题在数据表格中占据一列,方便后续的数据整理与分析。

在数据分析方面,我们采用了多种方法。首先,通过样本描述统计,我们利用频率分布表对样本进行了详细的分析,包括总样本百分比、有效百分比以及累积百分比等,这些数据为我们提供了大学生网络购物行为的基本概况。同时,我们还利用专业统计分析软件对数据进行处理,通过直方图和饼图直观地展示了每个变量状态的值,使得分析结果更加直观易懂。

其次,我们运用了因素分析的方法,通过解释变量之间的相关性来揭示数据结构。因子分析作为一种有效的数据分析工具,能够将大量变量归结为几个维度,从而简化数据结构。在本研究中,我们利用因子分析对大学生网络购物行为的影响因素进行了探究,进一步揭示了大学生网络购物行为背后的深层次原因。

此外,我们还采用了聚类分析的方法,特别是k-means聚类算法。这种方法有助于我们将具有相似网络购物行为特征的大学生群体进行归类,从而更好地理解不同群体之间的差异和共性。

最后,为了探究不同生活方式对大学生网络购物行为的影响,我们结合了交叉表和卡方检验。通过卡方检验,我们在显著性水平上检验了原始假设的合理性。随后,利用交叉表展示了不同生活方式类型的学生在网络购物行为上的差异,为电子商务企业针对不同生活方式的大学生制定个性化市场策略提供了有力支持。

用描述性统计

被调查学生性别统计:男生67人,女生140人。男女比例接近于1:2 。

image.png

image.png

从性别比例的频数表格来看,女生有140个人,占比67.6%,男生为67个人占比32.4%。因此被调查者中女生居多,男生偏少。

然后我们查看所有年级的比例

image.png

从饼图中我们可以看到,大四年级的学生占绝大多数,其次是大三学生。

image.png

从频数的表格来看,可以发现大四学生为111个人占比53.6%大三学生有36个人占比17.4%,大二学生有37个人占比17.9%。

然后我们查看被调查者的月生活费情况。

image.png

行业生活费中我们可以看到,大部分被调查者的月生活费在1000元到两千元之间,然后是两千元到三千元之间。

image.png

从表格来看,我们可以发现生活费在五千元以上的人有十五个人占比7.2%,月生活费在四千元到五千元,有七个人占比3.4%。生活费在两千元到三千元的人有55个占比26.6%。

然后我们查看被调查者每月的网购频率

image.png

从图中我们可以看到网购频率在3到5次的人占绝大多数。

image.png

从表格来看,我们可以发现网购频率在八次以上有28个人,占比13.5%。网购频率在6到8次之间的人有42个,占比20.3%。网络频率在3到5次的人有88个占比42.5。

信度分析

可靠性是指如果测量重复多次,则刻度产生一致结果的程度。 可靠性分析称为可靠性分析。 可靠性分析是通过获得规模中系统变异的比例来确定的,这可以通过确定从不同的规模管理获得的分数之间的关联来进行。 因此,如果可靠性分析中的关联度较高,则规模产生一致的结果,因此是可靠的。

image.png

一般来说,我们认为信度系数在0.8左右,较好的可信程度。从结果中我们可以看到系数在0.8左右,说明该调查有一定的可信度。

效度分析

有效性是概念, 结论或测量是有根据的,与真实世界准确对应的程度。 “有效”一词来自拉丁语有效性,意思强。 测量工具的有效性(例如,在教育中的测试)被认为是工具衡量其所要衡量的程度; 在这种情况下,有效性等同于准确性。检验变量是否适合于因子分析的常用方法是巴特利特球形检验)和检验。

本文生活方式量表的因子分析前提条件检验情况如表

image.png

表结果显示,球形度检验的近似卡方值为值为3259.28,小于说明原始矩阵不可能是单位阵,即原变量之间存在较高的相关性。度量值为,综合以上两点的验证结果得出本问卷的数据适合做因子分析。

因子分析

因子分析是通过解释变量之间的相关性来解释数据结构的方法。 因子分析通过将大量变量缩小为较小的一组潜在变量或因子将数据归结为几个维度。 它通常用于社会科学,市场研究和其他使用大数据集的行业。

因子分析是一种用于根据较少数量的潜在不可观察(潜在)“因素”对观察变量及其协方差结构进行建模的方法。这些因素通常被视为可能描述观察现象的广泛概念或观点。例如,获得一定社会水平的基本愿望可能解释了大部分的消费行为。这些不可观察的因素对社会科学家比观察到的定量测量更有趣。

为了使变量更好地适应因子分析的前提,我们需要根据调查结果净化初始变量。 常用的测量是变量的通用性(公因子方差),即单项对整体方差的贡献。 一般来说,需要初始变量来删除与变量不常用的变量,下一步是提取具有大于原始变量的变量共同性的因子。

image.png

image.png

image.png

通过上述分析,使用主成分分析提取因子,最大旋转因子的方差为了得到上述因子负荷量表,根据提取标准,提取大于因子负荷的特征值绝对值大于该因子。 这个比例从问题的问题中删除“您通常网购商品类型(服装服饰)的问题”保持负载值大于0.5问题。

因素的数量通常使用指数或特征值来确定。

提取正方形和负载列给出提取的因子方差贡献率 ,旋转后提取的共同因子的方差贡献因子由因子的数量给出特征值是一个二维空间图,可以更直观地显示每个因子的分布。

image.png

image.png

从上面的图可以看出,在第6个因子曲线出现明显的顶点,在第6个因子之前的曲线非常陡峭,而在第七个因子之后的曲线趋于平缓。在特征根和方差贡献表中,第一个常用因子解释变量的总方差,第二个共同因素解释变量的总方差第三个常见因素解释变量的总方差,第四个共同因素解释变量总方差的第五个共同因素解释变量总方差的第六个方差公开因素解释变量的总方差,累积贡献率,6个因子可以是变量信息的良好代表。

主成分分析中,由该因素的最高负荷变量的数量减少以得到最终因素,如下表所示:

image.png

image.png

从第一个因子的载荷中,我们可以发现在和最大的因素是因为”商品更新而进行网购”,”您选择网购的原因(时尚潮流) ,“您选择网购的原因(商品更新快) “ ,生活方式问题(追求时尚新颖的产品)”,是一种自发的、无意识的非计划性购物行为,而且具有一定的复杂性和情感因素,因此我们可以认为是冲动型购买。

聚类

k-means聚类是一种矢量量化的方法,最初来自于信号处理,在数据挖掘中受到聚类分析的欢迎。 k-means聚类旨在将n个观测值分为k个群集,其中每个观测属于具有最近平均值的群集,用作群集的原型。

问题在计算上是困难的(NP-hard);然而,通常采用有效的启发式算法并快速收敛到局部最优。这些算法通常通过两种算法所采用的迭代精化方法类似于高斯分布混合的期望最大化算法。此外,他们都使用集群中心来建模数据;然而,k均值聚类倾向于找到可比较空间范围的集群,而期望最大化机制允许集群具有不同的形状。

该算法与k-最近邻分类器有一个松散的关系,这是一种流行的用于分类的机器学习技术,由于名称中的k,常常与k-means混淆。可以在通过k-means获得的聚类中心上应用1最近邻分类器将新数据分类到现有的聚类中。这被称为最近的质心分类器或Rocchio算法。

通过对 这六个因子进行动态的聚类分析。根据统计原则,运用最终选择了三个聚类中心,即将大学生的生活方式分为三类,其判别分析结果如表所示。

聚类后,我们可以得到每个聚类中的样本数,各分群所含样本数及样本比例如表所示:

image.png

表中列出了六个要素得分中具体的三类组。 表中数据的积极分数越高,指数的识别程度越高; 负值越小,指数的识别程度就越高。

image.png

image.png

根据各分群生活方式因子的得分以及因子所包含的信息,对各分群进行描述与命名:

可以看到第一个类别中认同最大的是4号因子,用奖学金来购买,您通常网购商品类型(购票),您对网购担心的问题(个人隐私泄露),生活方式问题(愿意购买广告广泛宣传产品),通常网购商品类型(学习用品)。

卡方分析

卡方检验(也称为χ2检验)是任何统计假设检验,其中当零假设为真时,检验统计量的抽样分布为卡方分布。没有其他资格,“卡方检验”通常用作皮尔森卡方检验的简称。

卡方检验通常由平方误差或样本方差构成。遵循卡方分布的测试统计数据来自于独立正态分布数据的假设,这在许多情况下由于中心极限定理是有效的。可以使用卡方检验来尝试拒绝数据独立的零假设。

也被认为是一个卡方检验是一个这样一个渐近真实的测试,这意味着采样分布(如果零假设是真的)可以使样本大小变大,使其近似于所希望的卡方分布足够。卡方检验用于确定在一个或多个类别中预期频率和观察到的频率之间是否存在显着差异。

首先对性别与网购频率的维度做卡方检验,我们判断不同的性别的网购频率是否有差异。

image.png

从下面的表格中,我们可以看到一直小于0.05,拒绝零假设,表明不同性别的大学生在网购频率方面存在显著性差异。

image.png

从上面的直方图中,我们也可以判断出不同的性别对应的网购频率,明显的差别。

然后我们判断不同的月生活费对应的网络频率的维度做卡方检验,看是否有显著差别?

image.png

image.png

从上面的表格中,我们可以看到p小于0.05,因此认为不同的生活费对应的网购比例有显著的差别

QQ截图20191227152251.png

从上面的直方图来看,我们可以发现月生活费在1000到2000左右的网购次数最多最频繁。从网络购物频率的差异可以看到 ,可以认为不同的生活费对应的网购比例有显著的差别,不同性别的大学生在网购频率方面存在显著性差异。

A-new-value-agenda-is-taking-shape_1536x864.jpg

标签:变量,表和卡方,检验,SPSS,因子,因子分析,聚类,网购
From: https://www.cnblogs.com/tecdat/p/18076285

相关文章

  • 全量知识系统 因子分析+在线处理+实时库+生存拓扑控制+跨语言 的设想及百度AI答问 之3
    Q12.进一步,在因子分析+在线处理+生存拓扑控制的基础上,三种实时表的在线处理程序由三个不同程序语言的代理类来代理,以分离不同目标机的编程语言环境的影响。(因为,这里要限制目标编程语言中的数据类型以简化实现过程,并方便适应不同的应用需求).这三个代理类分别是:PythonBroker......
  • R语言因子分析、相关性分析大学生兼职现状调查问卷数据可视化报告
    全文链接:http://tecdat.cn/?p=31765原文出处:拓端数据部落公众号随着大学的普及教育,大学生就业形势变得更加困难,很多学生都意识到这个问题。所以走出象牙塔,去接触社会,来增长社会经验也会成为一个必然趋势。而大学生兼职既可以接触社会锻炼自己,又可以使自己的经济条件得到一定的改......
  • R语言聚类分析、因子分析、主成分分析PCA农村农业相关经济指标数据可视化
    全文链接:https://tecdat.cn/?p=35360原文出处:拓端数据部落公众号随着农业和农村经济的快速发展,各地区之间的经济差异日益显著。为了更好地理解这种差异,并为政策制定提供科学依据,本研究帮助客户采用了聚类分析和因子分析、主成分分析3种无监督学习方法,对多个省份的农业、林业、牧......
  • R语言SVM、决策树与因子分析对城市空气质量分类与影响因素可视化研究
    全文链接:https://tecdat.cn/?p=35303原文出处:拓端数据部落公众号数据处理和分析在数据科学领域中扮演着至关重要的角色。确保数据的准确性和完整性是数据处理的首要任务。在本研究中,我们以空气质量数据为例,帮助客户进行了数据处理和分析。根据空气质量的指标(x1~x7),我们将30个城......
  • SPSS modeler关联规则、卡方模型探索北京平谷大桃产业发展与电商化研究
    原文链接:https://tecdat.cn/?p=35275原文出处:拓端数据部落公众号平谷区的大桃产业经历了30多年的发展历程,成为了中国著名的大桃之乡,世界最大的桃园。以大桃产业为主的果品产业已成为全国农业产业结构调整的特色代表,是名副其实的富民产业、生态产业,对农民就业、农村稳定和社会主......
  • 用SPSS估计HLM多层(层次)线性模型模型|附代码数据
    原文链接:http://tecdat.cn/?p=3230作为第一步,从一个不包含协变量的空模型开始 ( 点击文末“阅读原文”获取完整代码数据******** )。每所学校的截距,β0J,然后设置为平均,γ00,和随机误差ü0J。将(2)代入(1)产生要在SPSS中进行估算,请转至分析→混合模型→线性...相关视频**......
  • SPSS Modeler决策树分类模型分析商店顾客消费商品数据
    全文链接:https://tecdat.cn/?p=34926原文出处:拓端数据部落公众号随着大数据时代的来临,数据挖掘和分析在商业决策中扮演着越来越重要的角色。商店的顾客消费行为数据是商业决策的关键信息之一,通过对这些数据的深入分析,可以更好地理解顾客的消费习惯和偏好,从而优化商品销售策略,提......
  • SAS,Stata,HLM,R,SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据
    全文链接:http://tecdat.cn/?p=10809最近我们被客户要求撰写关于分层线性模型的研究报告,包括一些图形和统计输出。本文用于比较六个不同统计软件程序(SAS,Stata,HLM,R,SPSS和Mplus)的两级分层线性模型的过程和输出下面介绍的六个模型都是两级分层模型的变体,也称为多级模型,这是混合模型......
  • SPSS modeler用关联规则Apriori模型对笔记本电脑购买事务销量数据研究
    全文链接:https://tecdat.cn/?p=34709原文出处:拓端数据部落公众号自2011年全球PC出货量达到历史最高的3.64亿台后,全球PC市场出货量已经连续四年下滑。市场调研公司Gartner最新数据显示,2015年Q3全球PC销量同比降低7.7%,至7370万台。IDC数据更加不乐观,2015年Q3全球PC出货量共计7100......
  • R语言主成分、因子分析、聚类对我国城镇私营单位就业人员平均工资数据研究与分析
    分析师:HuaruiHe数据显示2019年全国城镇私营单位就业人员年平均工资为53604元,比上年增长8.1%,而2019年全国城镇非私营单位就业人员年平均工资为90501元,名义增长率9.8%,实际上,一直以来城镇私营单位就业人员年平均工资都要高于非私营单位,并且增长率也高与非私营单位,主要原因是非私营单......