首页 > 其他分享 >博弈论

博弈论

时间:2023-01-30 17:13:06浏览次数:51  
标签:状态 游戏 博弈论 ldots oplus SG operatorname

经典的公平组合游戏

nim 游戏

规则

\(n\) 堆物品,每堆有 \(a_i\) 个,两个玩家轮流取走任意一堆的任意个物品,但不能不取。
取走最后一个物品的人获胜。

结论

定义 $ Nim =a_1 \oplus a_2 \oplus \ldots \oplus a_n $ 。
当且仅当 $ Nim = 0 $ 时,该状态为必败状态;否则该状态为必胜状态。


威佐夫博弈

规则

有两堆各若干个物品,两个人轮流从任一堆取至少一个或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,取走最后一个物品的人获胜。

结论

若两堆物品个数分别为 $x , y ( x < y ) $ ,若 $ x = \lfloor ( y - x ) \times \frac{1+\sqrt{5}}{2} \rfloor$ ,则该状态为必败状态;否则该状态为必胜状态。


SG 函数

任何一个可以用SG函数解决的问题都可以抽象成一个有向图游戏,SG函数是用于为这种有向图游戏提供最优策略的。(SG(x)=0代表x为必败态,SG(x)!=0代表x为必胜态)

定义 \(\operatorname{mex}\) 函数的值为不属于集合 \(S\) 中的最小非负整数,即:

\[\operatorname{mex}(S)=\min\{x\} \quad (x \notin S, x \in N) \]

对于状态 \(x\) 和它的所有 \(k\) 个后继状态 \(y_1, y_2, \ldots, y_k\) ,定义 \(\operatorname{SG}\) 函数:

\[\operatorname{SG}(x)=\operatorname{mex}\{\operatorname{SG}(y_1), \operatorname{SG}(y_2), \ldots, \operatorname{SG}(y_k)\} \]

而对于由 \(n\) 个有向图游戏组成的组合游戏,设它们的起点分别为 \(s_1, s_2, \ldots, s_n\) ,则有定理:当且仅当 \(\operatorname{SG}(s_1) \oplus \operatorname{SG}(s_2) \oplus \ldots \oplus \operatorname{SG}(s_n) \neq 0\) 时,这个游戏是先手必胜的。同时,这是这一个组合游戏的游戏状态 \(x\) 的 SG 值。
这一定理被称作 Sprague-Grundy 定理(Sprague-Grundy Theorem), 简称 SG 定理。
SG 定理适用于任何公平的两人游戏, 它常被用于决定游戏的输赢结果。

标签:状态,游戏,博弈论,ldots,oplus,SG,operatorname
From: https://www.cnblogs.com/windymoon/p/17076664.html

相关文章

  • 博弈论
    公平组合游戏满足下面三个条件的游戏被认为是公平组合游戏:1.两个玩家,轮流决策,完全信息。2.双方的可行操作仅依赖于局面,与是谁无关。3.同一局面无法多次抵达,游......
  • 牛客小白月赛65 D-牛牛取石子(博弈论)
    https://ac.nowcoder.com/acm/contest/49888/D题目大意:一共有两堆石子,第一堆a个,第二堆b个,牛牛(先手)和牛妹轮流取石子:2种方案种挑一种1.第一堆取1个,第二堆取2个2......
  • 容斥原理+简单博弈论
    容斥原理2个韦恩图的面积并:\(S_1+S_2-S_1S_2\)3个韦恩圆的面积并:\(S_1+S_2+S_3-S_1S_2-S_1S_3-S_2S_3+S_1S_2S_3\)n个韦恩圆的面积并:\(S_1+S_2+...+S_n-S_1S_2-...-S......
  • 算法学习笔记(42)——博弈论
    博弈论博弈论NIM博弈台阶-Nim游戏公平组合游戏ICG有向图游戏Mex运算SG函数有向图游戏的和定理集合-Nim游戏拆分-Nim游戏NIM博弈给定\(n\)堆物品,第......
  • 博弈论
    博弈论,有时也称为对策论,或者赛局理论,​​应用数学​​​的一个分支,目前在​​生物学​​​、​​经济学​​​、​​国际关系​​​、​​计算机科学​​​、​​政治学​​......
  • 博弈论与强化学习——基础1 扩展型博弈
    博弈论与强化学习——基础1扩展型博弈表示形式——博弈树使用树状图来表示行动的次序和执行动作时的信息状态图中有两个参与者,进行了两个阶段的博弈结点:表示博......
  • 博弈论与强化学习 一 Minimax Q, Nash Q ,FFQ
    博弈解与强化学习二基础算法2.1引言一个随机博弈可以看成是一个多智能体强化学习过程,但其实这两个概念不能完全等价,随机博弈中假定每个状态的奖励矩阵是已知的,不需要......
  • 博弈论扩展 CFR算法 一 基本概念
    扩展扩展性博弈与CFR算法目录扩展扩展性博弈与CFR算法CFR算法的发展算法应用强化学习的结合学习资料:扩展型博弈——知识回顾表示形式——博弈树信息集informati......
  • 博弈论练习8 Northcott Game(取石子问题)
    题目链接在这里:​​I-NorthcottGame_牛客竞赛博弈专题班组合游戏基本概念、对抗搜索、Bash游戏、Nim游戏习题(nowcoder.com)​​这题是一个伪装的很好的取石子问题,可以发......
  • 博弈论练习5 小牛再战(取石子问题)
    题目链接在这里:​​F-小牛再战_牛客竞赛博弈专题班组合游戏基本概念、对抗搜索、Bash游戏、Nim游戏习题(nowcoder.com)​​这是比较经典的巴什博奕问题,在博弈论中想到的第......