首页 > 其他分享 >博弈论

博弈论

时间:2024-07-25 21:51:14浏览次数:11  
标签:状态 xor 函数 必败 博弈论 后继 SG

博弈论

策梅洛定理

考虑对于一个游戏,他满足以下的特点

  • 两人单挑,轮流操作

  • 信息公开透明

  • 没有随机因素

  • 有限步内必然结束

  • 不存在平局

根据策梅洛定理:对于这样的一个游戏,任何一个局面先手或者后手其中之一必然存在必胜策略。

如何证明呢?

我们先考虑最后的状态,根据游戏规则,必然有一方必胜。

  1. 如果已经到了最终状态,按照游戏规则,必然有一方已经获胜

  2. 如果某一状态的所有后继状态都为先手必胜,那么此状态先手必败。

  3. 如果某一状态存在后继状态为先手必败,那么此时先手必胜。

因此,任何一个局面一定存在某一方必胜。

SG 函数

我们把上面的定理转化为数学语言。

定义先手必败的状态为零,先手必胜的状态为非零。则最后一个状态一定为 \(0\)。

根据上面的定理,判断一个局面的必胜,只需要观察它的后继状态是否存在零即可,

我们定义 SG 函数为所有子状态 SG 函数的 mex,SG 函数记录了这一状态能转移到的所有子状态。

如果子状态 SG 存在零,那么此时 SG 函数一定不为零,即 如果某一状态存在后继状态为先手必败,那么此时先手必胜。

如果子状态 SG 全部大于零,那么此时 SG 函数一定能取到零,即 如果某一状态的所有后继状态都为先手必胜,那么此状态先手必败。

因此 SG 函数很好的模拟了上述的策梅洛定理,并且将它转化为了可运算的数学公式。

我们顺便完善 SG 函数的定义:

  • 阶数:能转移到 \(0\) 至 \(n-1\) 中任一阶状态的状态,称为 \(n\) 阶状态。

  • \(SG(x)=mex \{ SG(y)|x \to y \}\)

SG 定理

定义了 SG 函数,开始研究有关 SG 函数的运算,既然是运算,就涉及不同状态间的拆分和合并。

(注意:不同 SG 函数之间为不同子游戏的并列和包含关系,而不是上文所说的状态的前驱和后继关系,放在 Nim 游戏里就是不同石子堆的关系。)

令 \(z=x+y\) (状态 \(z\) 的子状态为 \(x,y\))。

  • 如果 \(SG(x)=0,SG(y)=0\) 那么显然必败。

  • 如果 \(SG(x)=1,SG(y)=0\),后继状态只可能是 \(SG(x)=0,SG(y)=0\),后继必败,所以当前必胜。

  • 如果 \(SG(x)=1,SG(y)=1\),后继状态只可能是 \(SG(x)=1,SG(y)=0\),\(SG(x)=0,SG(y)=1\),根据刚刚讨论的,无论怎么移动对方都会进入必胜态,所以当前必败。

这样得到结论,任意两个同阶的 SG 函数总能有一种操作使双方进行一轮操作后仍保持同阶,

先手无论怎么移动一定得到不同阶的后继状态。

对于任意一个不同阶的状态,对方一定能使它回到同阶的状态,这样先手又接到了一个同阶状态。

而随着越来越接近最终态,后继状态不停在减少,所以一定会落在 \(SG(x)=0,SG(y)=0\) 的必败状态上。

所以同阶必败,不同阶一定有一个同阶的后继状态,所以不同阶必胜。

以上讨论以分成两个子游戏为例,由于不同子游戏间一定是并列关系,所以 SG 函数也满足结合律和交换律。

综上,SG 函数的运算具有以下性质:

  • 满足交换律,结合律。

  • 单位元为零(必败状态)。

  • 同阶组合必败(逆元是自己) 。

通过瞪眼法 我们通过观察得到,SG 函数的性质实际上和异或运算是一样的。

因此得出结论:\(SG(x)=SG(x_1+x_2+ \dots +x_n)=SG(x_1)\ xor\ SG(x_2)\ \dots\ xor\ SG(x_n)\)

(感性证明:性质一样,理性证明)

SG 定理证明

设 $$z=x+y$$

根据定义

\[SG(z)=mex \{ SG(w)|z \to w \} \]

因为每次只能进行一次操作,设

\[x \to u,y \to v \]

\[w=(u+y)\ \bigcup\ (x+v) \]

\[SG(z)=mex \{ \{SG(u+y)|x \to u \}\ \bigcup\ \{SG(v+x)|y \to v \} \} \]

既然 \(u,v\) 是 \(x,y\) 的任意 后继状态,不妨设

\[u=0,v=0 \]

根据 SG 函数定义,显然

\[SG(u+y)=SG(u)\ xor\ SG(y) \]

\[SG(v+x)=SG(v)\ xor\ SG(x) \]

\[SG(z)=mex \{ \{SG(u)\ xor\ SG(y)|x \to u \}\ \bigcup\ \{SG(v)\ xor\ SG(x)|y \to v \} \} \]

根据 SG 函数定义

\[SG(u) \ne SG(x)\ ,SG(v) \ne SG(y) \]

所以

\[SG(x)\ xor\ SG(y) \ne SG(u)\ xor\ SG(y) \]

\[SG(x)\ xor\ SG(y) \ne SG(v)\ xor\ SG(x) \]

\[SG(x)\ xor\ SG(y) \notin \{ \{SG(u)\ xor\ SG(y)|x \to u \}\ \bigcup\ \{SG(v)\ xor\ SG(x)|y \to v \} \} \]

设 \(X=SG(x),Y=SG(y),W<SG(x)\ xor\ SG(y),Z = SG(x)\ xor\ SG(y)\ xor\ W\)

\[X\ xor\ Z = W\ xor\ Y < X \]

根据 SG 函数定义,必然存在

\[SG(u)=W\ xor\ Y < X \]

\[W=SG(u)\ xor\ Y \]

同理

\[W=SG(v)\ xor\ X \]

所以对于任意 \(W<X\ xor\ Y\),必然存在 \(W=SG(v)\ xor\ X\) 或 \(W=SG(u)\ xor\ Y\)。

因此对于任意 \(W<X\ xor\ Y\)

\[W \in \{ \{SG(u)\ xor\ SG(y)|x \to u \}\ \bigcup\ \{SG(v)\ xor\ SG(x)|y \to v \} \} \]

因此根据 \(mex\) 定义

\[SG(z)=SG(x)\ xor\ SG(y) \]

参考资料

完结撒花!!!

https://www.luogu.com.cn/article/shyocttb

https://blog.csdn.net/A_Comme_Amour/article/details/79347291

https://www.cnblogs.com/Ratio-Yinyue1007/p/18317441

标签:状态,xor,函数,必败,博弈论,后继,SG
From: https://www.cnblogs.com/ppllxx-9G/p/18321744

相关文章

  • 博弈论
    一、要素局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方......
  • 博弈论
    公平组合游戏两人进行公平博弈,只会出现你赢我输,你输我赢两种局面:定义必胜状态为先手必胜的状态,必败状态为先手必败的状态。有以下三条结论定理1:没有后继状态的状态是必败状态。定理2:一个状态是必胜状态当且仅当存在至少一个必败状态为它的后继状态。定理3:一个状态......
  • 博弈论
    1.树上删边问题sg函数的一个简单应用,把树拆成很多条以根节点为起点的链,就可以等效于nim问题。我们把叶子节点的sg赋值为0,一个节点的sg值为它儿子节点的sg值+1的异或和。最后判断根节点的sg值是否为0,再判断是先手必胜还是后手。点击查看代码#include<bits/stdc++.h>usingn......
  • 片集 - 思维(博弈论,etc.) - 1
    欢迎来看“片”(的简介)由于-\(看片\)-生涯转瞬即逝,于是我选择对“\(片\)”进行一定的总结:相信你一定看懂了由于开始的时间有一点晚,就姑且认为我以后会慢慢补充吧......\(P6970\)\([NEERC2016]\)\(Game\)\(on\)\(Graph\)解:博弈论首先,我们有更原始的问题:\(A\),\(B\)......
  • P2964 [USACO09NOV] A Coin Game S (博弈论 dp)
    P2964[USACO09NOV]ACoinGameS博弈论dp(乱取的)两个人都希望自己的价值最大,可以认为他俩是等价的。考虑设计dp状态,设\(f_{i,j}\)表示考虑了前\(i-1\)个,现在的先手\([i,i+j-1]\)个,他之后能得到的最大价值。转移肯定是从\(f_{i+j,k}\)转移过来,并且\(1\lek\le2j\)......
  • CF 1981 D. World is Mine (*1800) DP+博弈论
    CF1981D.WorldisMine(*1800)DP+博弈论题目链接题意:有\(n\)个蛋糕,每个蛋糕有一个美味值\(a_i\),\(Alice\)和\(Bob\)轮流吃蛋糕,\(Alice\)每次必须选择吃严格大于之前所吃的蛋糕美味程度。\(Bob\)随意选择。有人没有蛋糕可以吃时,游戏结束。\(Alice\)想吃更多......
  • 博弈论
    请善用目录导航(大纲)公平组合游戏ICG若—个游戏满足:由两名玩家交替行动;在游戏进程的任意时刻,可以执行的合法行动与轮到哪名玩家无关;不能行动的玩家判负;则称该游戏为一个公平组合游戏。NIM博弈属于公平组合游戏,但城建的棋类游戏,比如围棋,就不是公平组合游戏。因为围棋交......
  • 博弈论小记
    博弈论目录博弈论公平组合游戏\(N/P\)\(SG\)函数\(SG\)和Nim游戏EasyGameTakeAwayHungergameStaircaseLasker'sNim翻硬币问题例题P4363[九省联考2018]一双木棋chess题目描述solutionP5363[SDOI2019]移动金币题目大意solutionP3185[HNOI2007]分裂游戏题目大意solution博......
  • 纳什均衡:博弈论中的运作方式、示例以及囚徒困境
    文章目录一、说明二、什么是纳什均衡?2.1基本概念2.2关键要点三、理解纳什均衡四、纳什均衡与主导策略五、纳什均衡的例子六、囚徒困境七、如何原理和应用7.1博弈论中的纳什均衡是什么?7.2如何找到纳什均衡?7.3为什么纳什均衡很重要?7.4如何计算纳什均衡?7.5纳什均衡......
  • 博弈论——洛谷P6560 [SBCOI2020] 时光的流逝
    [SBCOI2020]时光的流逝题目背景时间一分一秒的过着,伴随着雪一同消融在了这个冬天,或许,要是时光能停留在这一刻,该有多好啊。......“这是...我在这个小镇的最后一个冬天了吧。”“嗯,你可不能这辈子都呆在这个小镇吧。外面的世界很大呢,很大很大...”“唔...外面的世界...突然......