首页 > 其他分享 >鞅与停时定理

鞅与停时定理

时间:2024-10-18 21:59:10浏览次数:7  
标签:停时 ... frac 定理 varphi ia aligned sum

鞅与停时定理

呆猫不会数学,要证明也是直接抄别人的,不如直接放一篇(

详细证明及介绍

主要写点,对鞅与停时定理的理解

定理与势能函数

对于一个随机过程\(\{X_0,X_1,...,X_t\}\),其中\(X_t\)是终止状态,对于构造出的函数,设为\(\varphi(X_i)\),有以下要求:

  • \(E(\varphi(X_{i+1})-\varphi(X_i)|X_0,X_1,...,X_i)=-1\),即随着时间,势能减少
  • 要求末状态\(\varphi(X_t)\)唯一对应一个值,即\(\varphi(X_i)=\varphi(X_t)\)当且仅当\(i=t\)

构造序列\(Y_i=\varphi(X_i)+i\),则\(E(Y_{n+1}|X_0,X_1,...,X_n)=Y_n\),所以\(Y\)是\(X\)的鞅,那么就有

\[\begin{aligned} E(Y_t)&=E(Y_0)\\ E(\varphi(X_t))+E(t)&=E(\varphi(X_0)) \end{aligned} \]

所以\(E(\varphi(X_0))-E(\varphi(X_t))\)就可得到答案

然后\(E(\varphi(X_{i+1})-\varphi(X_i)|X_0,X_1,...,X_i)=-1\)这里不一定是\(1\),只要是常数就行,如果是其他的数的话只要改一下\(Y_i\)的定义即可

大体方向

大致就是,构造一个势能函数\(F(a_1,a_2,...,a_n)\),其中\(a_i\)表示每个局面,要使得\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}=E(F(a_1,a_2,...,a_n))-1\),其中\(\{b_i\}\)是\(\{a_i\}\)的后继状态,\(p_{\{b_i\}}\)是后继为\(\{b_i\}\)的概率,在题目中是等概率的,这里这样写是为了直观

鞅与停时定理,可知答案为\(E(S)-E(T)\)

这里\(E(F(a_1,a_2,...,a_n))\)就是\(E(\varphi(X_n))\),\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}\)就是\(E[\varphi(X_{n+1})]\)

其实反过来也行,就\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}=E(F(a_1,a_2,...,a_n))+1\),答案为\(E(T)-E(S)\)

一般都是设\(F(a_1,a_2,...,a_n)=\sum_{i=1}^nf(a_i)\),然后构造出\(f(x)\)

例题

CF1025G

显然我们现在的\(a_i\)可以表示为挂在第\(i\)个点下面的节点个数

按理来说,应该列式有\(\sum_{\{b_i\}} f(\{b_i\})-f(\{a_i\})=-1\),\(luogu\)上好像有这么分析的,但是更多数都是直接去找了两个\(a_i\)和\(a_j\),设为\(a\)和\(b\),然后直接列式:

\[\begin{aligned} f(a)+f(b)-1&=\frac{f(a+1)+bf(0)}2+\frac{f(b+1)+af(0)}2\\ &=\frac{f(a+1)+f(b+1)+(a+b)f(0)}2 \end{aligned} \]

发现这样实际是要求了任意一组\(a\),\(b\)的后继差是\(1\),比原本的要求更严格,是可能没有解的

然后因为势能函数是能我们自己设定的,设\(f(0)=0\),则得到:

\[f(a)+f(b)-1=\frac{f(a+1)+f(b+1)}2 \]

因为\(f(a)\)和\(f(b)\)是对称的,所以得到\(f(a)-\frac12=\frac{f(a+1)}2\),化一下式子得到\(f(a)-1=\frac{f(a+1)-1}2\)

那么可知\(f(n)=1-2^n\)

CF850F

按照套路,设出\(f(a_i)\),那么初始就是\(\sum_i f(a_i)\)

设\(sum=\sum_if(a_i)\),\(s=\sum_ia_i\),列式:

\[\begin{aligned} -1+sum&=\frac1{s(s-1)}(\sum_{i\neq j}a_ia_j(sum-f(a_i)-f(a_j)+f(a_i+1)+f(a_j-1))+\sum_ia_i(a_i-1)sum)\\ -1&=\frac1{s(s-1)}\sum_{i\neq j}a_ia_j(-f(a_i)-f(a_j)+f(a_i+1)+f(a_j-1))\\ -1&=\frac1{s(s-1)}\sum_ia_i(f(a_i+1)+f(a_i-1)-2f(a_i)) \end{aligned} \]

设\(g(x)=f(x+1)+f(x-1)-2f(x)\),因为\(g(x)\)都对称,所以有:

\[\begin{aligned} -1&=\frac1{s(s-1)}\sum_ia_ig(a_i)\\ &\Rightarrow g(x)=\frac{1-s}{s-x} \end{aligned} \]

那么也就有

\[f(x+1)+f(x-1)-2f(x)=\frac{1-s}{s-x} \]

设\(h(x)=f(x)-f(x-1)\),则有

\[h(x+1)-h(x)=\frac{1-s}{s-x} \]

想要得到\(f(x)\),只需对右边那个两次前缀和即可

然后因为\(s\)可能会很大,所以要手推一个式子来算,\(f(a_i)\)倒是都可以递推出来

关于赋初值,看到有几种:

  • \(f(0)=f(1)=0\)
  • \(f(0)=0\),\(h(0)=m-1\) \(\righarrow\) \(f(s)=0\)
  • \(f(0)=0\),\(h(1)=-\frac{m-1}m\)

容易发现,几乎可以给\(h(1)/h(0)\)代入任何值,只要满足我们上面说的两点限制即可,具体代什么值看怎么方便,可以保留\(f(0)\),\(h(0)/h(1)\)到式子中,最后看代什么值好算即可

学长的文章里的这道题就用的这种方式 https://www.cnblogs.com/Illusory-dimes/p/15832042.html#

参考资料(鸣谢)

https://www.cnblogs.com/houzhiyuan/p/17991053

https://www.cnblogs.com/Illusory-dimes/p/15832042.html#

https://www.cnblogs.com/C202044zxy/p/16340757.html

https://www.luogu.com.cn/article/0d1a9nbm

https://www.cnblogs.com/zltzlt-blog/p/18035649

标签:停时,...,frac,定理,varphi,ia,aligned,sum
From: https://www.cnblogs.com/LuoyuSitfitw/p/18473413

相关文章

  • 03-第一中值定理、微积分基本定理、牛莱公式、泰勒公式(转)
    一、第一中值定理如果函数f(x)在闭区间[a,b]上连续,则在积分区间[a,b]上至少存在一个点ξξ,使得∫baf(x)dx=f(ξ)(b−a).(a⩽ξ⩽b)∫abf(x)dx=f(ξ)(b−a).(a⩽ξ⩽b)二、微积分基本定理积分上限函数:函数f(x)在区间[a,b]上连续,对于定积分∫xaf(x)dx∫axf(x)dx每一个取值的x......
  • Stolz 定理及其证明
    Stolz定理是处理分式极限的强大工具,其形式类似未定式函数极限的洛必达法则.定理一:设数列\(\{b_n\}\)严格单调递增且趋于\(+\infty\).若\[\lim_{n\rightarrow\infty}\dfrac{a_n-a_{n-1}}{b_{n}-b_{n-1}}=A\]则\(\{a_n/b_n\}\)收敛,且\[\lim_{n\rightarrow\infty}\dfra......
  • Coppersmith定理
    原理用到格基规约和LLL算法。。。啊?你问那是什么?去搜吧,反正我没看懂。实现有一个e阶的多项式f,那么可以:在模n意义下,快速求出以内的根给定β,快速求出模某个b意义下较小的根,其中b≥​​​,是n的因数。一般采用sage下的small_roots(X=2^kbits,beta=β)。应用c......
  • 威尔逊定理
    初识威尔逊定理什么是威尔逊定理,即对于一个质数p来说,有(p-1)!≡-1(modp)恒成立,其逆定理也成立,即对于一个数p来说若满足上式,则p一定是素数。于是通过这个性质我们能够得到素数分布的函数:f(n)=sin(π*((n-1)!+1)/n)当函数值为0时,对应n就是一个素数,但好像没用(确信。推......
  • 威尔逊定理
    测试一下\[(A−1)!≡ −1 mod A\]其中A为素数1.从代码中可以知道:p=(B1!)%A1p=(B1!)%A1q=(B2!)%A2q=(B2!)%A22.又由[威尔逊定理](A−1)!≡ −1 mod3.而B=A-random.randint(1e3,1e5),所以在B的前面补上(A−1)(A−2)(A−3)...(B+1)就有(A−1)(A−2)(A−3).......
  • 快乐数学2勾股定理0000000
    2勾股定理在任意一个直角三角形中,两条直角边的平方和等于斜边的平方。a²+b²=c²a和b分别表示直角三角形的两条直角边长度。c表示斜边长度。我们大多数人都认为这个公式只适用于三角形和几何图形。勾股定理可用于任何形状,也可用于任何将数字平方的公式。2.1了......
  • 二项式定理来源
    这是国庆作业。很巧的是我的二项式定理学习笔记正好是去年国庆时写的。因为是发视频作业,所以这算是稿子。在中国,成书于1世纪的《九章算术》提出了世界上最早的多位正整数开平方、开立方的一般程序。11世纪中叶,贾宪在其《释锁算书》中给出了“开方作法本原图”,满足了三次以上开......
  • 行列式求法和矩阵树定理
    1.矩阵树定理无向图,有n个点,如果说i-j之间有连边,那么矩阵g[i][j]=g[j][i]=-1(i-j之间的边的数量),否则值为0矩阵上对角线上的值为该点的度数,g[i][i]=d[i];生成树个数:任选i,去掉i行i列之后的行列式的值生成树的权值=边权的乘积,所有生成树的权值之和?i-j之间右边,g[i][j]=......
  • 介值定理
    什么是介值定理?介值定理(IntermediateValueTheorem,简称IVT)是微积分中的一个基本定理。简单来说,介值定理告诉我们,如果一个函数在一个区间上是连续的,那么这个函数会“覆盖”该区间内所有介于其端点函数值之间的值。定理的正式表述:如果函数$f$在闭区间\([a,b]\)上连续,且$......
  • 算术基本定理
    一个整数可以被表示成若干质数的乘积。例如:\(48=2^4\times3,\49=7^2,\50=2\times5^2\)。算术基本定理:设\(a>1\),那么必有\(a=p_1^{\alpha_1}p_2^{\alpha_2}\cdotsp_s^{\alpha_s}\),其中\(p_i\(1\lei\les)\)是两两不相同的质数,\(\alpha_i\(1\lei\le......