首页 > 其他分享 >决策论——贝叶斯决策的R实现(二)

决策论——贝叶斯决策的R实现(二)

时间:2023-04-10 22:23:25浏览次数:42  
标签:方案 实现 0.2 天气 决策 H2 贝叶斯 d1

决策是理性人普遍从事的一种活动,也是极为重要的制胜手段。它的核心是,对未来活动的多个目标及用途做出合理的选择,以寻求最满意的行动方案。决策具有以下特点:①面对新问题和新任务做出科学决定,属于创造性的管理活动;②必须对实际行为有直接的指导作用;③具有多因素、多目标、不要确定性与方案的多样性,以及决策影响的时效性和一次性。风险型决策,是指决策者对未来情况无法做出肯定的判断,但是可以预测不同自然状态发生的概率以及条件收益。这样决策者采取的每一种策略的预测结果都是用不同自然状态出现的概率表示的,因此不管决策者采取哪一种行动方案,都要冒一定的风险,它是决策理论的核心内容。

一、风险型决策决策树法

1.1 决策的三大要素

(1)不可控因素——自然状态。它是不以人的意志为转移的客观因素,其集合又叫状态空间,记为
$$ Θ=\{θ_1,θ_2,…,θ_m\} = \{θ_і\} \quad i=1,2,…,m $$
Θ的元素\(θ_і\) 叫做状态变量。
(2)可控因素——决策方案。它是有待人们进行选择的主观因素,其集合叫做决策(或策略,或行为,或行动,或方案,或活动)空间,记为
$$A=\{a_1,a_2,…,a_n\} = \{a_j\} \quad j=1,2,…,n$$
A的元素\(a_j\) 叫做决策变量。
(3)在外界环境某种状态\(θ_і\) 发生时,决策方案\(a_j\) 实施后的损益值记为\(u_{ij}\),它显然是θі 和aj的函数。
$$u_{ij} =u(θ_і,a_j)\quad i=1,2,…,m;j=1,2,…,n$$

1.2 决策树法

例1:为了适应市场的需要,某地提出了扩大电视机生产的两个方案。一个方案是建设大工厂,第二个方案是建设小工厂。建设大工厂需要投资600万元,可使用10年。销路好每年赢利200万元,销路不好则亏损40万元;建设小工厂投资280万元,如销路好,3年后扩建,扩建需要投资400万元,可使用7年,每年赢利190万元。不扩建则每年赢利80万元。如销路不好则每年赢利60万元。经过市场调查,市场销路好的概率为0.7,销路不好的概率为0.3,试用决策树法选出合理的决策方案。

计算各点的期望值:
点②:0.7×200×10+0.3×(-40)×10-600(投资)=680(万元)
点⑤:1.0×190×7-400=930(万元)
点⑥:1.0×80×7=560(万元)
比较决策点4的情况可以看到,由于点⑤(930万元)与点⑥(560万元)相比,点⑤的期望利润值较大,因此应采用扩建的方案,而舍弃不扩建的方案。
把点⑤的930万元移到点4来,可计算出点③的期望利润值:
点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
由于点③(719万元)与点②(680万元)相比,点③的期望利润值较大,因此取点③而舍点②。
这样,相比之下,建设大工厂的方案不是最优方案。合理的策略应采用前3年建小工厂,如销路好,后7年进行扩建的方案。

二、贝叶斯决策

例2:某工程项目按合同应在三个月内完工,其施工费用与工程完工期有关。假定天气是影响能否按期完工的决定因素,如果天气好,工程能按时完工,获利5万元;如果天气不好,不能按时完工,施工单位将被罚款1万元;若不施工就要付出窝工费2千元。根据过去的经验,在计划实施工期天气好的可能性为30%。为了更好地掌握天气情况,可以申请气象中心进行天气预报,并提供同一时期天气预报资料,但需要支付资料费800元。从提供的资料中可知,气象中心对好天气预报准确性为80%,对坏天气预报准确性为90%。问如何进行决策。
【解析】采用贝叶斯决策方法,根据已有资料做出决策损益表。

好天气θ1(0.3) 坏天气θ2(0.7) E(dj)
d1 施工 5 -1 0.8
d2 不施工 -0.2 -0.2 -0.2

(1)先验分析
根据期望值准则选择施工方案有利,相应最大期望收益值EMV(先)=0.8。
(2)预验分析
完全信息的最大期望收益值:EPPI=0.3×5+0.7×(-0.2)=1.36(万元)
完全信息价值: EVPI=EPPI- EMV
(先)=1.36-0.8=0.56(万元)
即,完全信息价值大于信息成本,请气象中心进行预报是合算的。
**(3)后验分析

①补充信息:气象中心将提供预报此时期内两种天气状态x1(好天气)、x2(坏天气)将会出现哪一种状态。
从气象中心提供的同期天气资料可得知条件概率:
天气好且预报天气也好的概率 P(x1/θ1)=0.8
天气好而预报天气不好的概率 P(x2/θ1)=0.2
天气坏而预报天气好的概率 P(x1/θ2)=0.1
天气坏且预报天气也坏的概率 P(x2/θ2)=0.9
②计算后验概率分布:根据全概率公式和贝叶斯公式,计算后验概率。
预报天气好的概率 =0.31
预报天气坏的概率 =0.69
预报天气好且天气实际也好的概率:
=0.3×0.8/0.31=0.77
预报天气好而天气坏的概率:
=0.7×0.1/0.31=0.23
预报天气坏而实际天气好的概率:
=0.3×0.2/0.69=0.09
预报天气坏且实际天气也坏的概率:
=0.7×0.9/0.69=0.91
上述计算可以用表格表示:
先验概率
条件概率
P(xi∩θj)
后验概率

P(θj) X1 X2 X1 X2 X1 X2
θ1 0.3 0.8 0.2 0.24 0.06 0.77 0.09
θ2 0.7 0.1 0.9 0.07 0.63 0.23 0.91

P(x1)=0.31
P(x1)=0.69

后验决策:
若气象中心预报天气好(x1),则每个方案的最大期望收益值
E(d1/x1)=0.77×5+0.23×(-1)=3.62
E(d2/x1)=0.77×(-0.2)+0.23×(-0.2)=-0.2
选择d1即施工的方案,相应在预报x1时的最大期望收益值E(X1)=3.62
若气象中心预报天气不好(x2),各方案的最大期望收益值
E(d1/x2)=0.09×5+0.91×(-1)=-0.46
E(d2/x2)=0.09×(-0.2)+0.91×(-0.2)=-0.2
选择d2即不施工的方案,相应在预报x2时的最大期望收益值E(X2)=-0.2
④ 计算补充信息的价值:
得到天气预报的情况下,后验决策的最大期望收益值:
=0.31×3.62+0.69×(-0.2)=0.9842
则补充的信息价值为:EMV(后)- EMV(先)=0.9842-0.8=0.1842
补充信息价值大于信息费(800元),即这种费用是合算的。

三、贝叶斯决策R计算

例3:某企业设计出一种新产品,有两种方案可供选择:—是进行批量生产,二是出售专利。这种新产品投放市场,估计有3种可能:畅销、中等、滞销,这3种情况发生的可能性依次估计为:0.2,0.5和0.3。方案在各种情况下的利润及期望利润如下表。

畅销θ1(0.2) 中等θ2(0.5) 滞销θ3(0.3) E(dj)
d1 批量生产 80 20 -5 24.5
d2 出售专利 40 7 1 11.8

企业可以以1000元的成本委托专业市场调查机构调查该产品销售前景。若实际市场状况为畅销,则调查结果为畅销、中等和滞销的概率分别为0.9、0.06和0.04;若实际市场状况为中等,则调查结果为畅销、中等和滞销的概率分别为0.05、0.9和0.05;若实际市场状况为滞销,则调查结果为畅销、中等和滞销的概率分别为0.04、0.06和0.9。问:企业是否委托专业市场调查机构进行调查?
解:
1.验前分析:
记方案d1为批量生产,方案d2为出售专利
E(d1)=0.280+0.520+0.3(-5)=24.5(万元)
E(d2)=40
0.2+70.5+10.3=11.8(万元)
记验前分析的最大期望收益为E1,则E1=max{E(d1),E(d2)}=24.5(万元)
因此验前分析后的决策为:批量生产
E1不作市场调查的期望收益
2.预验分析:
(1)设调查机构调查的结果畅销、中等、滞销分别用H1、H2、H3表示
由全概率公式
P(H1)=0.90.2+0.060.5+0.040.3=0.232
P(H2)=0.05
0.2+0.90.5+0.050.3=0.475
P(H3)=0.040.2+0.060.5+0.90.3=0.308
(2)由贝叶斯公式有
P(Ɵ1|H1)=0.9
0.2/0.232=0.776
P(Ɵ2|H1)=0.060.5/0.232=0.129
P(Ɵ3|H1)=0.04
0.3/0.232=0.052
P(Ɵ1|H2)=0.050.2/0.475=0.021
P(Ɵ2|H2)=0.9
0.5/0.475=0.947
P(Ɵ3|H2)=0.050.3/0.475=0.032
P(Ɵ1|H3)=0.04
0.2/0.308=0.026
P(Ɵ2|H3)=0.060.5/0.308=0.097
P(Ɵ3|H3)=0.9
0.3/0.308=0.877
(3)用后验分布代替先验分布,计算各方案的期望收益值
a)当市场调查结果为畅销时
E(d1|H1)=80* P(Ɵ1|H1)+20* P(Ɵ2|H1)+(-5)* P(Ɵ3|H1)
=800.776+200.129+(-5)0.052=64.4(万元)
E(d2|H1)=40
P(Ɵ1|H1)+7* P(Ɵ2|H1)+1* P(Ɵ3|H1)
=400.776+70.129+10.052=31.995(万元)
因此,当市场调查畅销时,最优方案是d1,即批量生产
b)当市场调查结果为中等时
E(d1|H2)=80
P(Ɵ1|H2)+20* P(Ɵ2|H2)+(-5)* P(Ɵ3|H2)=20.46(万元)
E(d2|H2)=40* P(Ɵ1|H2)+7* P(Ɵ2|H2)+1* P(Ɵ3|H2)
=400.021+70.947+10.032=7.501(万元)
所以市场调查为中等时,最优方案是:d1,即批量生产
c)当市场调查结果为滞销时
E(d1|H3)=80
P(Ɵ1|H3)+20* P(Ɵ2|H3)+(-5)* P(Ɵ3|H3)
=800.026+200.097+(-5)0.877=-0.365(万元)
E(d2|H3)=40
P(Ɵ1|H3)+7* P(Ɵ2|H3)+1* P(Ɵ3|H3)
=400.026+70.097+10.877=2.596(万元)
因此市场调查为滞销时,最优方案是:d2,即出售专利
(4)通过调查,该企业可获得的收益期望值为
E2= E(d1|H1)
P(H1)+ E(d1|H2)* P(H2)+ E(d2|H3)* P(H3)
=64.40.232+20.460.475+2.596*0.308=25.46(万元)
通过调查,该企业收益期望值能增加
E2-E1=25.46-24.5=0.96(万元)
因此,在调查费用不超过0.96万元的情况下,应进行市场调查
3.验后分析
(1)本题中调查费用1000<9600,所以应该进行市场调查
(2)当市场调查结果为畅销时,选择方案1,即批量生产
(3)当市场调查结果为中等时时,选择方案1,即批量生产
(4)当市场调查结果为滞销时,选择方案2,即出售专利

总结

风险型决策方法不同于确定型决策方法,应用风险型决策方法必须具备以下条件:①具有决策者期望达到的明确目标;②存在决策者可以选择的两个以上的可行备选方案;③存在着决策者无法控制的两种以上的自然状态(如气候变化、市场行情、经济发展动向等);④不同行动方案在不同自然状态下的收益值或损失值(简称损益值)可以计算出来;⑤决策者能估计出不同的自然状态发生个概率。风险型决策与非确定型决策比较,两者都面临着两种或两种以上的自然状态,不同的是前者掌握了它们的出现概率而后者对即将出现的自然状态、概率一无所知。
解决风险型决策问题的方法通常有两种:损益期望值准则和决策树法。其中损益期望值准则只适合解决单级决策问题(即只有一个决策点的问题) ;决策树法既适合单级决策问题也适合多级决策问题(即解决二个以上决策点的问题) 。但通常在使用损益期望值准则和决策树法进行决策时不考虑资金的时间价值,这在某些情况下往往会引起决策的失误,尤其当决策问题考虑的时间较长时。考虑资金时间价值与不考虑资金时间价值会得出不同的计算结果,因此引起了决策的差别。应该讲,决策方案的使用期越长,不考虑资金时间价值带来的误差越大,会引起决策方案的改变。所以在风险型决策中应考虑资金的时间价值。

参考资料

  1. 贝叶斯决策的经典例题练习
  2. 贝叶斯决策
  3. 风险型决策与贝叶斯决策

标签:方案,实现,0.2,天气,决策,H2,贝叶斯,d1
From: https://www.cnblogs.com/haohai9309/p/17304179.html

相关文章

  • 数组、链表、跳表的基本实现和特性
    1.如何对链表加速  2.添加第一级索引  3.添加第二级索引  4.增加N级索引  5.思量及索引添加流程解释  5_1.如何找到数字8  5_2.如何找到数字9  6.跳表查询的时间复杂度分析  6_2.时间复杂度例题  ......
  • 课上测试-科技政策查询系统(实现分页显示和模糊查询)
    今天的软工课上,老师给我们布置了课堂小测试,要求我们做一个简单的科技政策查询系统,具体要能实现模糊查询和分页显示。老师没有要求我们完成数据结构和树形结构分类,总体还是比较容易的。 代码请见我下一篇博客:https://www.cnblogs.com/rsy-bxf150/p/17304267.html题目要......
  • 课上测试-实现分页显示和模糊查询(代码部分)
    今天的软工课上,老师给我们布置了课堂小测试,要求我们做一个简单的科技政策查询系统,具体要能实现模糊查询和分页显示。这里展示我实现的代码。目前实现了基本功能,还有点小不完善,之后再改一改吧。Query.javapackagemain;importdao.Bean;importdatas.DB;importj......
  • 分页查询的实现过程
    分页查询目前我看到的最简单的分页查询的实现就是直接在servlet查询得到list列表之后,在jsp页面或者html页面引用<%进行实现1、首先,获取到session保存的list数据List<docu>list=(List<docu>)request.getSession().getAttribute("list");//此处是取出所存储的数据2、设置......
  • 在DongshanPI-D1开箱使用分享与折腾记录&实现MPU6050数据读取
    前言上一篇文章使用RT-Smart的IIC驱动OLED屏幕,进行基本的字符串显示,在使用过程中对RT-Smart有了一定熟悉,准备使用SPI驱动ST7789,但SPI接口没有引出,本次使用手上已有的传感器MPU6050进行使用。过程本次直接开始添加离线包在/D1S/userapps/rt-thread/bsp/allwinner/d1s下输入scon......
  • :hover下拉框的实现
    通过绝对定位与:hover实现的下拉框效果;一开始没什么大问题,效果也都实现了;但观察对应的项目发现其中的文字其实是超连接所以后续添加了超连接标签后就无法通过:hover进行展示了。源代码<divclass="header-bottom"><ul><ahref=""><li>首页</li>......
  • 借用gcc内置函数帮助C来实现函数重载
    借用gcc内置函数__builtin_choose_expr和__builtin_types_compatible_p可以帮助c来实现函数重载。首先对这两个函数功能做下介绍__builtin_choose_expr(expr,expr1,expr2)与c语言:?运算符有些类似,如果expr表达式为真,那么返回expr1,否则返回expr2_builtin_types_compatible_p(ty......
  • 从零开始USRP 03 实现一个USRP收发demo(hello world)
    这里用的源码来自:UHDC/C++编程实例USRP发送、接收数据我所使用的USRP型号是N210r4,因此默认地址的最后一位是4,使用Ubuntu20.04运行(至于为什么之前配的是18.04,那是因为之前是在我的虚拟机上玩耍的,但是我的虚拟机配网络有点麻烦,因此我给学姐的学长借了一台Linux笔记本,用这台笔......
  • spring boot单库动态分表实现【增删查】(含源码)
    一.背景现实场景中当个别业务数据量过大时会影响系统功能性能,当整个业务还没有达到分库的级别时,动态分表也是一个的选择,基本思想是按照一定维度将数据分表存储动态查询。本次实现的是基于springboot的单表动态增删查,首先分表的规则根据一个格式生产,包含时间在其中,每一条数据......
  • 深入理解 python 虚拟机:字节码教程(2)——控制流是如何实现的?
    深入理解python虚拟机:字节码教程(2)——控制流是如何实现的?在本篇文章当中主要给大家分析python当中与控制流有关的字节码,通过对这部分字节码的了解,我们可以更加深入了解python字节码的执行过程和控制流实现原理。控制流实现控制流这部分代码主要涉及下面几条字节码指令,......