首页 > 其他分享 >R语言用决策树的酒店收入和产量预测可视化研究

R语言用决策树的酒店收入和产量预测可视化研究

时间:2024-02-03 20:55:59浏览次数:26  
标签:酒店 预测 模型 可视化 产量 app 决策树

全文链接:https://tecdat.cn/?p=35130

原文出处:拓端数据部落公众号

现代社会经济的发展,促进了酒店业的投资热潮, 投资者投资一个酒店,必须在投资前对若干经营数据进行科学预测与分析,对酒店可能形成的收入成本水平进行估算,从而对投资的风险进行有效预测。

酒店管理者在借鉴西方发达国家经验数据的基础上,在星级酒店的具体运营过程中,通过反复验证和探讨,推演出了一批符合中国国情的经验数据,在此以较为常用的计算模块对酒店的运营数据模型进行阐述,我们根据提供的数据,帮助客户建立酒店产量预测模型(收入预测模型),通过此模型能识别出哪些酒店可以通过调整三个预订渠道的价格(b渠道卖价, c渠道卖价, e渠道卖价)使得单酒店在三个预订渠道的总产量(或总收入)最大。

1)     相关数据字段如下:

image.png

方法

决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测(就像上面的银行官员用他来预测贷款风险)。

image.png

建模分析

首先我们读取2016-01-01至2016-03-30的历史数据作为训练数据,我们可以对部分训练数据进行查看

image.png

然后我们读取测试数据并且以2016-04-9至2016-04-15的数据为测试集评测预测的准确度
同样的,我们可以查看测试数据

image.png

然后我们计算单酒店在三个预订渠道的总产量(或总收入)

   
data$income=data$b_price_after_app +data$c_price_after_app +data$e_price_after_app  
test$income=test$b_price_after_app +test$c_price_after_app +test$e_price_after_app

在简单的进行数据处理后,我们对数据建立决策树
并且得到以下的决策树模型

image.png

从模型结果来看,这个决策树一共有四个分支。然后我们要找出产量排名前四分之一酒店,因此对每个酒店的产量进行绘制

image.png

然后使用刚才得到的决策树模型对他们进行预测,并对每家酒店的间夜预测值(或收入)与实际值的对比结果

然后绘制实际值和预测值的比较图

QQ截图20240201153928.png

从对比图来看,我们可以发现,红色的代表预测的数据,而黑色的线代表着准确度的衡量直线,当预测点越靠近准确度线,那么该模型的预测效果越好,从该图形来看,红色的点,分布在黑色的直线周围,说明该模型的预测结果较好

为了对误差进行量化,我们计算产量排名前四分之一酒店平均误差值
并且使用如下的公式:
(∑|每天酒店预测值-每天酒店实际值|/每天酒店实际值)/天数

image.png

从结果来看,误差在2%左右说明该模型的预测效果较好

在对收入进行预测之后,我们将同样的过程应用到酒店产量预测

image.png

从决策树结果来看,我们可以看到该模型有八个分支

同样的,我们将对酒店的产量进行汇总

image.png

并且,得到排名靠前的酒店产量

在得到预测结果之后,我们对每家酒店的间夜预测值(或收入)与实际值的对比结果

绘制实际值和预测值的比较图

image.png

从对比图来看,我们可以发现,红色的代表预测的数据,而黑色的线代表着准确度的衡量直线,当预测点越靠近准确度线,那么该模型的预测效果越好,从该图形来看,红色的点,分布在黑色的直线周围,说明该模型的预测结果较好

为了对误差进行量化,我们计算产量排名前四分之一酒店平均误差值

(∑|每天酒店预测值-每天酒店实际值|/每天酒店实际值)/天数

image.png

可以看到酒店产量的预测误差在4%左右,说明该模型的预测效果较

最后,我们将所有的预测结果进行汇总,并且输出 :

image.png

结论

综上所述,通过建立酒店产量预测模型,可以有效识别出通过调整三个预订渠道的价格使得单酒店在三个预订渠道的总产量(或总收入)最大的方法。通过对历史数据的分析和决策树模型的构建,可以对酒店的收入和产量进行科学预测。实验结果表明,该模型具有较好的预测效果,预测误差在2%左右,对酒店投资者和管理者提供了重要的决策依据。通过科学预测和分析,投资者可以更好地评估投资风险,酒店管理者可以优化酒店运营策略,提高酒店的经营效益。因此,在现代社会经济发展的背景下,建立酒店产量预测模型具有重要的实际意义和应用价值。

QQ截图20220227134423.png

标签:酒店,预测,模型,可视化,产量,app,决策树
From: https://www.cnblogs.com/tecdat/p/18005184

相关文章

  • Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格
    全文链接:https://tecdat.cn/?p=33809原文出处:拓端数据部落公众号随机波动模型(Stochasticvolatilitymodels)经常被客户用来对股票价格随时间的变动性进行建模。波动性(volatility)是随时间的对数收益的标准差。与假设波动性恒定不变不同,随机波动模型具有隐变量参数,可以在每个时刻......
  • R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例|附代
    原文链接:http://tecdat.cn/?p=25044原文出处:拓端数据部落公众号最近我们被客户要求撰写关于结构方程模型的研究报告,包括一些图形和统计输出。1简介在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。第一种有时称为“路径分析”,而后者有时称为“测量模型”。......
  • 数据可视化中常见的图表
    数据可视化是将数据信息通过图形的方式展示出来,以便更直观地理解和分析数据。以下是一些常用的数据可视化图表类型:柱状图(BarChart)-用于展示不同类别的数据量对比。折线图(LineChart)-展示数据随时间或其他变量变化的趋势。饼图(PieChart)-显示各部分占整体的比......
  • R语言时变向量自回归(TV-VAR)模型分析时间序列和可视化|附代码数据
    全文链接:http://tecdat.cn/?p=22350 最近我们被客户要求撰写关于时变向量自回归(TV-VAR)模型的研究报告,包括一些图形和统计输出。在心理学研究中,个人主体的模型正变得越来越流行。原因之一是很难从人之间的数据推断出个人过程另一个原因是,由于移动设备无处不在,从个人获得的时间......
  • R语言社区检测算法可视化网络图:ggplot2绘制igraph对象分析物种相对丰度
    原文链接:http://tecdat.cn/?p=23836原文出处:拓端数据部落公众号我们使用R中的igraph包,产生了网络的图形。但是很难将这些图表放到演讲和文章中,因为图表很难根据需要定制。使用igraph中的绘图功能可以得到你想要的结果,但用ggplot对工作更有帮助。所以本文探索了一种在ggplot中创......
  • 开启古董背后的故事:古董展览可视化大屏的互动体验
    在我们的生活中,科技与传统的交融已经变得无处不在。走进古董的世界,仿佛打开了时光的闸门,每一件古董都承载着千年的故事与历史。然而,传统的古董展览方式,往往受限于空间和展示手段,难以让每一位观众深入地感受到古董背后的历史与文化。此时,古董展览可视化大屏的出现,为这一难题提供了......
  • 借助可视化表单搭建企业级低代码平台,实现流程化办公!
    实现高效率的流程化办公,利用低代码技术平台可以为企业带来高效益的办公目的。可视化表单是较为流行的办公利器,流辰信息经验足、产品丰富、服务品质好,可以为更多的企业搭建专属于企业的低代码技术平台,创造高效益的办公。1、低代码技术平台的市场价值什么是低代码平台?它究竟有什么......
  • 探索军事基地可视化的奥秘:从数据采集到实战应用
    随着科技的飞速发展,军事领域也在经历着前所未有的变革。军事基地可视化系统通过运用先进的大数据、物联网、云计算等技术,将复杂的战场信息以直观、立体的方式呈现出来。这种技术为军事指挥官提供了更加精准的决策依据,让他们能够更好地掌握战场态势,迅速作出判断和指挥。 ↑图为......
  • 长连接网关技术专题(九):去哪儿网酒店高性能业务网关技术实践
    本文由去哪儿网技术团队田文琦分享,本文有修订和改动。1、引言本文针对去哪儿网酒店业务网关的吞吐率下降、响应时间上升等问题,进行全流程异步化、服务编排方案等措施,进行了高性能网关的技术优化实践。技术交流:-移动端IM开发入门文章:《新手入门一篇就够:从零开发移动端IM》......
  • R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
    全文链接:http://tecdat.cn/?p=31996原文出处:拓端数据部落公众号GAMLSS模型是一种半参数回归模型,参数性体现在需要对响应变量作参数化分布的假设,非参数性体现在模型中解释变量的函数可以涉及非参数平滑函数,非参数平滑函数不预先设定函数关系,各个解释变量的非线性影响结果完全取决......