首页 > 数据库 >SQL Server Analysis Services数据挖掘聚类分析职业、地区、餐饮消费水平数据

SQL Server Analysis Services数据挖掘聚类分析职业、地区、餐饮消费水平数据

时间：2023-03-15 23:55:22浏览次数：80

标签：样本分类 Analysis 类别聚类数据挖掘职业餐厅聚类分析

全文链接：http://tecdat.cn/?p=31887

原文出处：拓端数据部落公众号

本文通过 SQL Server Analysis Services数据挖掘的分析模块，帮助客户对一个职业、地区、餐饮消费水平的数据挖掘，并用可视化分析图表显示数据。该结果可为餐饮业的管理者提供决策依据，进而使餐饮企业获得更多利润。同时，挖掘出与该职业相对应的地区及消费水平，可以为职业发展规划、餐饮市场的开拓提供有效依据。

准备工作：数据.xls 数据导入数据库中。

将表格命名

在相应数据库中找到对应的数据

商业智能项目

选择商业智能项目，analysis services项目，并选择目标文件夹

在解决方案资源管理器中，右键单击数据源，选择新建数据源

在解决方案资源管理器中，右键单击挖掘结构，选择新建挖掘结构

设置输入数据与键Id

设置训练集和测试集的百分比

点击部署模型

看到右下角部署完成

查看结果

从聚类结果可以看到，聚类将所有用户分成了2个聚类结果。

从不同类别的依赖图可以看到，类别10、4、8、6、7、5之间具有较强的相关关系。说明这几个类别中的变量特征是类似的。下面可以具体看下每个类别中的各个属性的分布的比例。

另外一个聚类中，1、2、9为一个聚类簇，说明这几类别中的变量特征类似。

同时可以看到每个变量再每个类别中的分布情况

可以看到消费水平很低的样本主要分布在分类10中

从上图可以看到餐饮消费水平较高的类别是1，2,9类别中。

下面可以看到各个分类的剖面图

可以看到每个分类中各个level所占的比例。西餐主要分布在分类1、2中。拍档主要分布在分类6、10中。

年龄的分布也非常明显。大多数分布在26岁左右，分类10的样本年龄最大。同时可以看到分类1 和9 的收入最高，同时他们常去的餐厅类型为西餐。同时可以看到所在城市在分类3中主要是通辽和根河市。他们主要去的餐厅类型是中餐和排档。在分类9中，可以看到医生职业的样本主要去的也是中餐类型。分类1中可以看到，去西餐的样本主要是少了的医生。

然后可以看到总体的分类特征。最常去的餐厅类型为中餐，其次是西餐。年收入最多的区间是51900到67000之间。餐饮消费在10元到18元之间。样本的主要年龄段在20岁到25岁。所在城市主要为根河市，其次是乌兰浩特。样本的职业中，最多的是客服专员。

从每个类别的倾向程度来看，分类1中，主要的样本区的是西餐餐厅。每次的消费在20到30元之间。年收入在8万到12万之间，说明这些样本的收入较高。其中，行政主管所占的百分比较高。有少量的创意总监。

从每个类别的倾向程度来看，分类1中，主要的样本区的是西餐餐厅。他们所在的城市主要在鄂尔多斯。

从每个类别的倾向程度来看，分类3中，主要的样本收入在3万3到3万6之间。他们的职业主要是文案策划，常去的餐厅为非西餐餐厅。

从每个类别的倾向程度来看，分类4中，主要的样本区的是中餐餐厅。主要的职业为市场总监。

从每个类别的倾向程度来看，分类5中，主要的样本区的是中餐餐厅。主要的职业为电工和电话销售以及教师。

从每个类别的倾向程度来看，分类6中，主要的样本去的是排挡餐厅。主要的职业为学生和服务员及会计师。该群体大部分收入较低或者没有收入。因此每次的餐厅消费也较低。

最受欢迎的见解

1.R语言k-Shape算法股票价格时间序列聚类

2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图

3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的层次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本挖掘聚类

7.R语言KMEANS均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化

8.PYTHON用户流失数据挖掘：建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像

9.R语言基于Keras的小数据集深度学习图像分类

标签：样本,分类,Analysis,类别,聚类,数据挖掘,职业,餐厅,聚类分析
From： https://www.cnblogs.com/tecdat/p/17220721.html

相关文章

ERROR 10516 --- [ restartedMain] o.s.b.d.LoggingFailureAnalysisReporter :
在IDEA上运行程序时遇到如下问题：如果你跟我一样也遇到了这个问题，那么大概率是端口冲突造成的。可能是之前运行的程序没有完全关闭从而影响到了现在的程序运行，最根本的解......
数据挖掘（第四周）
#代码8-1查看数据特征importnumpyasnpimportpandasaspdinputfile=r'C:\Users\86138\Downloads\data\数据挖掘与分析\GoodsOrder.csv'#输入的数据文件......
易基因：染色质免疫共沉淀测序(ChIP-seq）的数据挖掘思路｜干货系列
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。CHIP-seq研究的数据挖掘思路主要分为3步：整体把握CHIP-seq图谱特征：peak/reads在基因组上的分布、peak......
【819】emerging hotspot analysis数据集
参考：EmergingHotSpotAnalysis（前半部分是statichotspotanalysis）参考：dplyr说明文档运行例子里面的数据集可以，但是自己的数据集死活不行，开始以为是数据的问题，也就是......
文献阅读CDCL--Crypto-- SAT Solvers for Cryptanalysis
CDCL(Crypto)SATSolversforCryptanalysisAuthors: SaeedNejati VijayGanesh AuthorsInfo&ClaimsCASCON'19:Proceedingsofthe29thAnnualIntern......
【814】Static hotspot analysis and emerging hotspot analysis based on the R libr
Ref:EmergingHotSpotAnalysisRef:Ref:Statichotspotanalysislibrary(tidyverse)library(sf)library(openxlsx)library(ggplot2)library(tmap)tmap_mode("......
数据挖掘(2.2)--数据预处理
目录二、数据描述1.描述数据中心趋势1.1平均值和截断均值 1.2加权平均值1.3中位数（Median）和众数(Mode)2.描述数据的分散程度......
数据挖掘（第三周）
#客户城市分析importnumpyasnpimportmatplotlib.pyplotaspltfromdatetimeimportdatetimeimportseabornassnsfromsklearn.preprocessingimportStandard......
SAS数据挖掘EM贷款违约预测分析：逐步Logistic逻辑回归、决策树、随机森林
全文链接：http://tecdat.cn/?p=31745原文出处：拓端数据部落公众号近几年来，各家商业银行陆续推出多种贷款业务，如何识别贷款违约因素已经成为各家商业银行健康有序发展贷款业......
数据挖掘(2.1)--数据预处理
一、基础知识1.数据的基本概念1.1基础知识数据是数据对象(DataObjects)及其属性(Attributes)的集合。数据对象(一条记录、一个实体、一个案例、一个样本等)是对一个事物或......

赞助商

阅读排行