首页 > 其他分享 >数据分享|R语言逐步回归、方差分析anova电影市场调查问卷数据可视化|附代码数据

数据分享|R语言逐步回归、方差分析anova电影市场调查问卷数据可视化|附代码数据

时间:2023-06-06 23:44:06浏览次数:41  
标签:逻辑 语言 回归 电影 anova 方差分析 数据 模型

全文链接:http://tecdat.cn/?p=30680

最近我们被客户要求撰写关于电影市场调查问卷数据的研究报告,包括一些图形和统计输出。

这是一份有关消费者对电影市场看法及建议的调查报告,我们采取了问卷调查法,其中发放问卷256份,回收有效问卷200份 ( 点击文末“阅读原文”获取完整代码数据******** )。

我们对数据 ( 查看文末了解数据免费获取方式 ) 进行了基本分析,比如:相关性。还有基本图形、回归方差分析。最后模型比较。

图片

相关视频

**

拓端

,赞25

读入数据

 
head(data)

图片

数据的描述

 
str(data)

数据一共有200个样本,25个属性。具体属性和取值及其含义如下:

图片

数据展示

绘制各个变量的饼图可以看到基本人口信息的各个取值的所占的百分比。

图片

图片


点击标题查阅往期内容

图片

数据分享|数据视角可视化分析豆瓣电影评分爬虫数据

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

数据特性总结

基本统计量

图片

图片

数据准备

数据的清理

 
#数据清理

对缺失值(NA)的处理

data=na.omit(data)

 

#变量筛选

 colnames(data)

 

data=data[, -which(colnames(data) %in% c("填写时间","是否星标","提交后随机码" , "是否已

数据分析

基本数据分析,比如:相关性。还有基本图形、回归方差分析。最后模型比较。

数据检验

相关性

查看您对中国电影产业的发展建议和请问您看电影的主要目的是什么变量之间是否具有相关关系

图片

检验的结果是,由于P =0.016<0.05,因此在0.05的显署性水平下,拒绝原假设,认为两者之间具有相关关系。

下面进行方差分析

 
m1<-aov(Q12.您一般通过什么途径购买电影票~Q9.请问您看电影的主要目的是什么,data=datacor)

图片 由于p值大于0.05,从这个结果可以看出看电影的不同目下购买电影股票的差别不显著。

图片 由于p值小于0.05,从这个结果可以看出看电影的不同目下购买电影股票的差别不显著。

回归分析

图片

从回归模型的结果来看,可以看到接受电影票价格区间对被调查对象考虑的电影外在因素有比较大的影响,p值小于0.05,因此该变量对被调查者选择去看电影有显著的影响 。其次被调查者的年龄也有较明显的影响,可以年龄和被调查者去看电影有较大的负相关关系,因此可以认为年龄大的人会倾向于考虑的看电影各种外在因素。

 
plot(model)

图片

从回归模型的残差结果图来看,残差比较均匀地分布在0线周围,和qq图周围,说明残差随机服从正态分布,因此,回归模型具有较好的效果。

模型的比较和讨论

模型筛选与比较,使用逐步回归进行模型筛选最优模型,然后和传统的回归模型进行比较。删去不显著的变量.

图片

进行变量删减后的回归模型,我们得到最优变量是被调查者接受的电影票价格区间,p值小于0.05,说明该变量对被调查者考虑的外在因素有显著的影响。

图片

数据获取

在公众号后台回复“电影数据”,可免费获取完整数据。****

图片

图片

点击文末 “阅读原文”

获取全文完整代码数据资料。

本文选自《R语言电影市场调查问卷回归模型、方差anova分析可视化》。

点击标题查阅往期内容

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
逻辑回归(对数几率回归,Logistic)分析研究生录取数据实例
R语言使用Metropolis- Hasting抽样算法进行逻辑回归
R语言逻辑回归Logistic回归分析预测股票涨跌
R语言在逻辑回归中求R square R方
R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集
R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
R语言进行支持向量机回归SVR和网格搜索超参数优化
R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例
在R语言中实现Logistic逻辑回归
R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病
R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

标签:逻辑,语言,回归,电影,anova,方差分析,数据,模型
From: https://www.cnblogs.com/tecdat/p/17462091.html

相关文章

  • 基于JAVA的springboot+vue人事管理系统、员工工资管理系统,附源码+数据库+论文+PPT
    1、项目介绍考虑到实际生活中在人事管理方面的需要以及对该系统认真的分析,将系统权限按管理员和员工这两类涉及用户划分。(a)管理员;管理员使用本系统涉到的功能主要有:首页,个人中心,员工管理,部门管理,员工考勤管理,请假申请管理,加班申请管理,员工工资管理,招聘计划管理,员工培训管理,部......
  • 初级数据结构--栈在表达式求值的应用
    表达式一般有三部分组成:操作数、运算符、界限符我们常见的表达式一般都属于中缀表达式,比如:2*2/(1+1)-4/2+1后缀表达式中缀表达式便于人的理解,但不便于计算机的处理。于是便有了后缀表达式,也成逆波兰表达式。比如上面表达式手动转为后缀表达式为22*11+/42/-1+(提一下不常......
  • 智慧电网数据可视化运维云平台解决方案
    智慧电力概述智慧电力是通过采用先进的大数据、云计算、物联网、边缘计算等技术,实现生产信息与管理信息的智慧,实现人、技术、经营目标和管理方法的集成,是企业管理思想的一个新突破。智慧电厂建设具备智能化、一体化、可观测、可互动、自学习、自寻优等九大能力,可为管理者及时提供......
  • 智慧电网数据可视化运维云平台解决方案
    智慧电力概述智慧电力是通过采用先进的大数据、云计算、物联网、边缘计算等技术,实现生产信息与管理信息的智慧,实现人、技术、经营目标和管理方法的集成,是企业管理思想的一个新突破。智慧电厂建设具备智能化、一体化、可观测、可互动、自学习、自寻优等九大能力,可为管理者及时提供过......
  • 数组和元祖数据类型
    使用案例来讲解TS的数组类型和元祖类型数组类型方式一要求:定义一个数组这个数组只能存储数值类型的数据letvalArr:Array<Number>//定义一个数组类型存储数值valArr=[1,2,3]//正常valArr=["1","2",3];//会报错console.log(valArr);方式二字符串数组......
  • 每日记录(数据结构 第 三 章 栈与队列 二 )
    队列队列是一种先进先出(FIFO)(FIFO)(FIFO)的线性表.在表一端插入,在另一端删除。0.队列的基本概念定义只能在表的一端(队尾)进行插入,在另一端(队头)进行删除运算的线性表逻辑结构与线性表相同,仍为一对一关系存储结构用顺序队列或链队存储均可运算规则先进先出(FIFO)实现方式......
  • Python爬虫————泉州二手房数据爬取和数据可视化
    1.选题的背景我本次的主题是泉州二手房房价的调查分析。首先通过爬虫采集链家网上所有二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;将这些房源大致分类,以对所有数据的概括总结。通过上述分析,我们可以了解到目前市面......
  • 每日记录(数据结构 第 三 章 栈与队列 )
     一、栈栈(stack)(lastinfirstout)(stack)(last\infirst\out)(stack)(lastinfirstout)后进先出 栈的基本概念定义只能在表的一端(栈顶)进行插入和删除运算的线性表逻辑结构与线性表相同,仍为一对一关系存储结构用顺序栈或链栈存储均可,但以顺序栈更......
  • 大数据分析——对世界杯比赛进行分析及预测
    (一)选题背景:世界杯比赛是全球最大规模的国际足球赛事之一,吸引着数以亿计的观众。对于球迷和体育爱好者来 说,预测比赛结果是一项有趣且具有挑战性的任务。足球比赛结果的预测可以帮助球迷制定投注策略、提供比赛观看的参考以及评估球队和球员的表现。(二)方案设计:从网站中下载相关......
  • 数据结构与算法分析(Java语言描述)(14)—— 索引堆
    packagecom.dataStructure.heap;importjava.util.Arrays;publicclassIndexMaxHeap{//最大索引堆中的数据privateInteger[]data;//最大索引堆中的索引privateint[]indexes;privateintcount;privateintcapacity;//构造函数,......