首页 > 其他分享 >RLChina2022公开课-博弈论

RLChina2022公开课-博弈论

时间:2023-07-17 21:25:00浏览次数:40  
标签:帕累托 博弈 博弈论 RLChina2022 公开课 均衡 最优 纳什

纯博弈:

单纯的动机组合,离散的集合

混合博弈:

加入了概率论,以百分比的概率执行不同的的动机。,概率分布

零和博弈、合作博弈、协同博弈

扩展博弈和非完美信息

扩展博弈、贝叶斯博弈

纳什均衡

任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变)都不会提高自身的收益。

帕累托最优(Pareto Optimality)

从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕累托改进或帕累托最优化
纳什均衡与帕累特最优的比较
纳什均衡是一个稳定点,但不一定是最优点
帕累特最优是局部较好的一个点,并不代表有多稳定。

前面的博弈里面都有纳什均衡
扩展博弈里面:SPNE

贝叶斯博弈纳什均衡
把隐藏信息保存到一个概率空间
大家不知道隐藏信息具体值,但是知道概率分布

纳什均衡的时间复杂度

PPAD为基石

重复博弈:

联盟博弈

总结

标签:帕累托,博弈,博弈论,RLChina2022,公开课,均衡,最优,纳什
From: https://www.cnblogs.com/joiln/p/17030866.html

相关文章

  • RLChina2022-实践课三:强化学习算法
    MDP算法MDP被定义为一个元组(S,A,P,r,R)S:所有状态集合A:在环境力里面智能体所作动作的集合P:状态转移函数P(s'|s,a),智能体在当前s下,执行a之后,转移到是s'的概率R:奖励函数R(s,a),表示在环境s下执行动作a之后获得的立即奖励,有时候还需要知道s'是多少才能共同决定奖励是多少。......
  • 简单博弈论
    简单博弈论Nim游戏Nim游戏满足以下三个条件:(1)两名玩家交替行动(2)游戏过程中,可以执行的的行动和轮到哪位玩家没有关系(3)不能行动的玩家判负比如围棋就不是一种Nim游戏,因为围棋有黑白两子不满足(2),围棋判断输赢规则较为复杂不符合(3)。下面的取石子游戏就是一个Nim游戏:给......
  • 博弈论入门
    博弈论入门必败情况为P,必胜情况为N,我们要得出N一定有方法能转换到P,P任意操作都会到N1.巴什博弈两个顶尖聪明的人在玩游戏,有一堆n个石子,每次每个人能取\([1,m]\)个石子,不能拿的人输,请问先手与后手谁必败?1~m个石子,先手必胜反推m+1个石子只能到1~m,所以必败反推m+2~2*......
  • 博弈论之SG函数 学习笔记
    在许多地方曾经行过这样一个小游戏,摆出三堆硬币。分别包含3枚、5枚、7枚。两人轮流行动每次可以任选一堆,从中取走任意多枚硬币,可把一堆取完,但不能不取。取走最后一枚硬币者获得胜利。这类游戏可以推广为更加一般的形式:给定\(n\)堆物品,第\(i\)堆物品有\(A_i\)个。两名玩......
  • (博弈论)Even Number Addicts
    Alice和Bob正在一个序列 ai​ 上玩游戏,Alice先手,轮流玩。每一轮当前玩家可以取走序列中任意一个数,直到取完。如果最后Ailce取走的数的和为偶数,则Ailce赢,否则Bob赢。保证每个人用最优策略玩。对于每组数据,输出赢家。输入输出样例输入#1复制4313541357......
  • 【学习笔记】博弈论 ---- 非偏博弈
    博弈论入门前言:本篇按照Qingyu在省集讲的加入我这个萌新的萌新理解而成。听了Qingyu的博弈论讲解,感觉我之前学过的博弈就是冰山一角。由于有一些东西没听懂,就主要写写我听懂的部分,没懂得以后再说吧。所以这篇只是一个入门,关于博弈的一些习题可能会咕咕咕。平等博弈(非偏......
  • 博弈论
    博弈论在OI中主要研究组合博弈,可能也会与其它的知识点相结合。做博弈论题时,我们要利用已有的博弈结论,或是建出模型解决问题。组合博弈组合博弈一般分为两种:平等博弈:可允许的操作只和当前局面的状态而和操作的玩家无关。不平等博弈:可允许的操作还和当前操作的玩家相关。......
  • 博弈论
    基础概念相关参考资料:易老师整理(放个大佬的链接)NimGame题目:有n堆石子,数量分别为\(a_1,a_2,...,a_n\),两个玩家均足够聪明,轮流拿石子,每次仅可以从任意一堆中拿走任意数量的石子。结论:当\(a_1⊕a_2⊕...⊕a_n≠0\)时,先手必胜;否则先手必败。而且,令\(a_1⊕a_2⊕...⊕a_n=x\),则定......
  • J - Simple Game (博弈论外壳下的模运算考察题目)
    原题链接:https://vjudge.net/contest/555710#problem/J手工翻译:Alice和Bob在玩一个游戏有这样一个数列a1,a2,a3,a4……an长度为n,他们轮流移走一个整数当数列中没有可移走的整数时游戏结束,Alice移走的数的和是S1,Bob移走的数的和是S2如果abs(s1-s2)为奇数,Alice赢,否则Bob赢接下来给......
  • 博弈论入门
    博弈论有向图游戏Nim游戏Nim游戏的定义是,给定\(n\)堆石子,两个玩家去交替的拿石头,每次只能拿某一堆的石头,如果此时有一个玩家无法进行这个游戏了,则游戏结束。为了解决这个问题,比较直接的会先想到一个类似于\(DP\)的思路,考虑当前每个状态,去将其划分为两个状态,这里我们定义为\(P:......