首页 > 其他分享 >期望DP——解决从自身转移的情况

期望DP——解决从自身转移的情况

时间:2024-12-05 14:01:50浏览次数:8  
标签:概率 期望 int sum times DP 转移 dp

期望DP——解决从自身转移的情况

问题背景

可以进行若干次抽奖,每一次分别获得 \(0-k\) 个物品的概率 \(p_j\) 都是确定的,给定一个 \(X\) ,求抽到 \(X\) 个物品的期望抽奖次数。

如果定义 \(f_i\) 为获得 \(i\) 个物品的期望次数,那么这个转移方程也是十分显然:

\[f_i=1+\sum_{j=0}^kf_{i-j}\times p_j \]

出现的问题

从数学意义上思考,这个式子本身是没有问题的。

但是从程序的方面来思考,我们写一个 naive 的转移肯定是行不通的,因为这涉及到当 \(j=0\) 的时候 ,\(f_i\) 会从自身转移。

解决方法

可以通过解方程的方法来从数学的角度变形这个式子:

\[f_i=1+f_i\times p_0+\sum_{j=1}^kf_{i-j}\times p_j \]

再化简一下可以得到:

\[f_i=\frac{1+\sum_{j=1}^kf_{i-j}\times p_j }{1-p_0} \]

这个时候就可以发现转移方程里面不包含 \(f_i\) 本身了,可以直接转移。

例题

abc382_e

这个题并没有直接给出 \(p\) ,而是给出了 \(n\) 个相互独立的概率 ,所以开一个卡包获得 \(0-n\) 张卡的概率需要自己算。

这个题里面我们还需要人为处理一下 \(p\) ,这个也考虑从 DP 的角度来解决,定义 \(g_{i,j}\) 数组为考虑了前 \(i\) 张卡获得了 \(j\) 张卡的概率,这样的话转移还是就挺明显的 :

\[g_{i,j}=g_{i-1,j}\times (1-p_i)+g_{i-1,j-1}\times p_i \]

然后剩下的就直接套上面的流程即可。

Code

#include<bits/stdc++.h>
using namespace std;
const int N=5010;
double f[N],g[N][N];
int n,x;
double p[N];
int main()
{
    cin>>n>>x;
    for(int i=1;i<=n;++i)scanf("%lf",&p[i]),p[i]/=100.0;
    g[0][0]=1;
    for(int i=1;i<=n;++i)
    {
        g[i][0]=g[i-1][0]*(1-p[i]);
        for(int j=1;j<=i;++j)
            g[i][j]=g[i-1][j-1]*p[i]+g[i-1][j]*(1-p[i]);
    }
    f[0]=0;
    for(int i=1;i<=x;++i)
    {
        f[i]=1;
        for(int j=max(0,i-n);j<i;++j)
        {
            f[i]+=f[j]*g[n][i-j];
        }
        f[i]/=(1-g[n][0]);
    }
    printf("%.16lf",f[x]);
    return 0;
}

abc314_e

类似于完全背包,有 \(n\) 个不同的卡包,每一个都可以选择无限次

Code

#include<bits/stdc++.h>
using namespace std;
int n,m;
const int N=200;
int c[N],num[N];
int s[N][N];
double p[N][10010];
double f[N];
int main()
{
    cin>>n>>m;
    for(int i=1;i<=n;++i)
    {
        cin>>c[i]>>num[i];
        double plus=1.0/(num[i]*1.0);
        for(int j=1;j<=num[i];++j)cin>>s[i][j],p[i][s[i][j]]+=plus;
    }
    for(int i=1;i<=m;++i)f[i]=1e18;
    f[0]=0;
    for(int i=1;i<=m;++i)
    {
        for(int j=1;j<=n;++j)
        {
            double tmp=c[j];
            for(int k=1;k<=m;++k)
                tmp+=f[max(i-k,0)]*p[j][k];

            /*关于此处“无效状态”的思考:如果说 k 的遍历已经完成,但是都从无效状态转移,也就是tmp仍然等于 c[j] ,
            这意味着当前考虑的组内,所有可能的取值都比 i 大,满足了我们 "f[i]为至少达到i的分数所需要的代价" 的定义,
            而这个代价自然就是 C[j]。

            此外,不免会思考:多出来的那一部分怎么办?
            比如说 玩意我算出来的 f[1] 实际上是获得了 2 分的代价呢?
            那么会发现计算 f[2] 的过程中肯定会考虑到这一个答案,而这时 f[2] 就变成了 "刚刚好" 的类型,再进行后续的转移。
            
            总之,这个dp数组(f数组)的定义 本身就是“至少”而不是“刚刚好”。
            */
            tmp/=1-p[j][0];
            f[i]=min(f[i],tmp);
        }
    }
    printf("%.10lf",f[m]);
    return 0;
}

abc342_f

题意

这个题严格意义上来讲其实并没有涉及到从自身转移的情况,但是属于是比较难的一道期望DP,而且还是比较典型。

题意就是你可以先抛若干次骰子,每次都可以等概率地获得 \(1-D\) 的点数,记最后你获得的点数为 $ x$ 。紧接着另外一个人也丢若干骰子,他的投掷过程和你的完全独立,直到他获得至少 \(L\) 分之前,他都不会停止,记最后他获得的分数是 \(y\) 。

给定一个分数上界 \(N\) 。

如果最后你的点数 \(x\) 大于 \(N\) , 那么你就输了。

否则:

  • 如果 \(y>N\) 或者 \(x>y\) ,就可以获胜。
  • 否则就失败。

现在询问按照最优策略行事,最后获胜的概率多少?

分析

这是一个类博弈问题,我们尝试定义 \(dp_i\) 为:从总计得到 \(i\) 点数之后进行操作获得的最大获胜概率,那么这时候就有两种决策:

  1. 再投一次骰子。
  2. 不投了。

对于情况 1 ,可以转化为子问题求解。

也就是

\[\frac{\sum_{j=i+1}^{i+D}dp_j}{D} \]

对于情况 2 ,这时候我们就要对于确定的 \(x\) ,来看看 \(y\) 的概率分布,从而确定获胜情况。

由于两个过程是相互独立的,所以我们可以预处理出 \(y\) 最后停在任意一点的概率,实际问题的意义上考虑,\(y\) 最后所在的位置肯定只能是 \([L,L+D-1]\) 的区间内,我们定义 \(g\) 数组为所求的数组,发现 \(g\) 数组的每一个 \(g_i\) 会以 \(\frac{1}{D}\) 的等概率转移给他之后 \([1,D]\) 的 \(g_j\) ,那么这个区间加的过程实际上可以通过差分、树状数组、线段树的方式来优化,这里选择的是差分。

由于我们正序枚举 \(y\) 可能的位置,所以只会对后面的产生加减,那么一边枚举一边对差分数组进行前缀和 ,可以同时得到当前位置的概率。并且我们在 \(i\ge L\) 的时候就会停止前进,那么只需要枚举 \([0,L-1]\) 的 \(i\) 即可。

考虑对于一个给定的 \(x\) ,去计算 \(y\) 对应的能使之获胜的概率,显然就是 \(ans_x=1-\sum_{i=L}^Ng_i+\sum_{i=L}^{x-1}g_i\) ,如果 \(L>x-1\) 的话那么最后一项对应是 \(0\) 。这个显然可以通过前缀和进行优化。

最后的转移方程就是

\[dp_i=\max(\frac{\sum_{j=i+1}^{i+D}dp_j}{D},ans_x) \]

其中 DP 的区间和可以通过双指针的思想O(1)求出。

Code

#include<bits/stdc++.h>
using namespace std;
int n,l,d;
const int N=2e5+10;
double dif[N<<1],g[N<<1],sg[N<<1];
inline void pre()
{
    cin>>n>>l>>d;
    g[0]=1.0;
    dif[1]=1.0/d,dif[1+d]=-dif[1];
    for(int i=1;i<=l-1;++i)
    {
        dif[i]+=dif[i-1],g[i]=dif[i];
        dif[i+1]+=g[i]/d,dif[i+d+1]-=g[i]/d;
    }
    for(int i=l;i<=N;++i)dif[i]+=dif[i-1],g[i]=dif[i],sg[i]=sg[i-1]+g[i];
}
double dp[N<<1];
double calc_Y(int x)
{
    double ans=1-sg[n];
    if(x)ans+=sg[x-1];
    return ans;
}
int main()
{
    pre();
    double sum=0;
    for(int i=n;i>=0;--i)
    {
        dp[i]=max(sum/d,calc_Y(i));
        sum+=dp[i],sum-=dp[i+d];
    }
    printf("%.15lf",dp[0]);
    return 0;
}

abc333_f

标签:概率,期望,int,sum,times,DP,转移,dp
From: https://www.cnblogs.com/Hanggoash/p/18580461

相关文章

  • .NET Core 线程池(ThreadPool)底层原理浅谈
    https://www.cnblogs.com/lmy5215006/p/18566995 文提到,创建线程在操作系统层面有4大无法避免的开销。因此复用线程明显是一个更优的策略,切降低了使用线程的门槛,提高程序员的下限。.NETCore线程池日新月异,不同版本实现都有差别,在.NET6之前,ThreadPool底层由C++承载。在之后......
  • [dp] 飞翔
    题目描述鹰最骄傲的就是翱翔,但是鹰们互相都很嫉妒别的鹰比自己飞的快,更嫉妒其他的鹰比自己飞行的有技巧。于是,他们决定举办一场比赛,比赛的地方将在一个迷宫之中。这些鹰的起始点被设在一个n∗......
  • 初识UDP(编写一个回显服务器)
    目录初识UDP(编写一个回显服务器)UDPsocketAPI的使用实现一个回显服务器服务器代码客户端代码实现效果代码解释流程解释初识UDP(编写一个回显服务器)UDP是传输层的协议操作系统提供了UDPAPI(操作系统提供给我们进行网络编程的API叫做“socketAPI”---->“网络......
  • [Linux网络]TCP和UDP协议的底层理论
    目录一、TCP和UDP协议的简单认识1.传输层协议2.五元组二、UDP协议1.UDP协议格式2.UDP协议的特点3.面向数据报4.UDP传输报文在内核中的管理5.基于UDP协议的应用层协议(部分)三、TCP协议1.发送和接收数据示意图2.TCP协议格式3.确认应答机制和超时重传机制4.发......
  • 决策单调性优化dp学习笔记
    点的第一个省选级算法,算是一个很好的过渡。决策单调性,也称四边形不等式优化dp。主要适用于转移式子大概长这样的时候:\(f_i=\min/\max\{f_j+w(j,i)\}\),其中\(w(j,i)\)满足四边形不等式。四边形不等式当\(a\leb\lec\led\)时,若存在$w(a,c)+w(b,d)\lew(a,d)+w(b,c)......
  • ui设计中px、pt、ppi、dpi、dp、sp之间的关系?
    Let'sbreakdowntherelationshipsbetweentheseunitsinUIdesign,specificallyforfront-enddevelopment:Pixels(px):Definition:Apixelisthesmallestaddressableelementonadisplay.It'saphysicalunit,representingasinglepoint......
  • 【恐怖の算法】 背包DP
    【恐怖の算法】背包DP引入在具体讲何为「背包dp」前,先来看如下的例题:题目传送门:洛谷P2871[USACO07DEC]CharmBraceletS在上述例题中,由于每个物体只有两种可能的状态(取与不取),对应二进制中的\(0\)和\(1\),这类问题便被称为「\(0-1\)背包问题」。\(0-1\)背包解释例题......
  • 【解决方法】vscode import cv2报错Import "cv2" could not be resolvedPylancereport
    报错一般是opencv-python装的环境与当前环境不是同一个1.没有装opencv-pythonpipinstallopencv-python -ihttps://pypi.tuna.tsinghua.edu.cn/simple2.装错了在左侧扩展栏目中搜索@workspaceUnsupported下拉点击表示 在右侧加入信任文件ctrl+shift+p在下来菜单中......
  • E86 换根DP CF1324F Maximum White Subtree
    视频链接:E86换根DPCF1324FMaximumWhiteSubtree_哔哩哔哩_bilibili  MaximumWhiteSubtree-洛谷|计算机科学教育新生态//换根DPO(n)#include<bits/stdc++.h>usingnamespacestd;constintN=200005;vector<int>e[N];intn,a[N],f[N];voiddfs(int......
  • TCP/IP 和 UDP
    一、TCP/IP(传输控制协议)TCP/IP是一个协议族,它是互联网的基础协议,为网络通信提供了标准化的方法。TCP/IP分为四个层次,每一层都有特定的功能:应用层:这是最接近用户的层,包含了所有高级协议,如HTTP(网页浏览)、FTP(文件传输)、SMTP(邮件传输)等。应用层负责应用程序之间的交互,确保数......