首页 > 其他分享 >《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS

《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS

时间:2022-11-18 16:48:31浏览次数:40  
标签:selfish 狩猎 选择 代理人 2018 AAMAS 猎鹿 agents 收敛

环境:

  • 猎鹿博弈(即代理人要么选择有风险的合作政策,单独代理人选择会导致低收益;要么选择一个安全的合作政策,无论怎么样都会有安全收益)存在多个纳什均衡的环境

    h > c >=m > g
  • 创新点:
    • 目标:最终收敛到狩猎均衡获得更高收益,而不是低收益的均衡
    • 采用亲社会代理人机制,代理人考虑伙伴的奖励采取动作

      其中参数代表代理人的亲社会水平,当参数超过临界值后可以逐渐增加收敛后的社会总收益(定理)
    • 设计出发点:假设每个代理人都有一个信念值p代表期待伙伴选择狩猎的概率,代理人之间会对这种信念值做出回应,如果伙伴选择了狩猎,那么p值就会上升。

      由此可以找到p的临界值
  • 适用环境有限,如果不是类似猎鹿博弈的环境中,可能会收敛到次优解

标签:selfish,狩猎,选择,代理人,2018,AAMAS,猎鹿,agents,收敛
From: https://www.cnblogs.com/e557/p/16903701.html

相关文章

  • 2018年辽宁省电子设计大赛D题手势识别装置
    一转眼,两年过去了。距离这个比赛已经好久。我此时(2020年5月28日)已然大四,马上要念研究生了。现在回头看这篇我刚开始接触写的文章,还没有学会markdown,而且认识也比较粗浅。大......
  • 2018-11-8-内置函数(2)
    主要内容一.1.locals()2.globals()3.complex4.binocthex5.abs6.divmod7.round8.pow(x,y,z=1)9.sum10.min/max11.reversed12.slice13.format14.bytes15.bytearray16.memory......
  • LG_P4588 [TJOI2018] 数学计算 题解
    LuoguP4588题解这个玩意还是挺好想到的,也不难看出他是一个线段树。没想到可以评上蓝。考虑每次操作对于答案的贡献。由于\(x=1\),所以我们相当于是在维护一堆数的积,初始......
  • luogu P4786 [BalkanOI2018]Election
    题面传送门离谱题,结论出奇的简单。首先我们考虑\(O(nq)\)怎么做。显然所有C都要放在最终序列中,然后问题就变成往里面填T。我们考虑第一个T填在能填的最开始的位置上,因......
  • P5017 NOIP2018 普及组 摆渡车
    P5017NOIP2018普及组摆渡车-洛谷|计算机科学教育新生态(luogu.com.cn)显然要把人按照到达时间排序。然后考虑dp。设\(f(i)\)表示前\(i\)个人已上车或到达目......
  • NEO与以太坊:为什么NEO可能是2018年最强的加密货币
    NEO,它可以与以太坊竞争吗?NEO和以太坊你会下重注投资其中的哪一个? 2013年年末,以太坊创始人VitalikButerin(V神)发布了以太坊初版白皮书,启动了项目。2014年7月24日起,以太坊......
  • 2018之后的Unity3d制作AR教程
    自2017.4以后的unity版本,AR的SDK已经被集成,那么如何用2018unity3d制作AR呢?1.首先打开Unity3d2018,然后打开File->BuildingSetting,接着打开PlayerSetting,找到XRSetting......
  • Nexus RCE CVE-2018-16621/CVE-2020-10204
    POST/service/extdirectHTTP/1.1Host:xxxxxxxxxUser-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64;rv:106.0)Gecko/20100101Firefox/106.0Accept:*/*Accep......
  • PS滤镜Nik Collection 2018 for mac中文版合集 v1.2.15汉化版
    ps滤镜NikCollection2018formac中文版是一个大合集,NikCollectionformac这是一款Mac平台的强大的作图插件套装,内含全部Nik的6个针对Photoshop、Lightroom和Aperture......
  • 《神经网络与深度学习》最新2018版中英PDF+源码
    机器学习AI算法工程 公众号:datayx资料获取1.关注微信公众号datayx 然后回复 深度学习即可获取。不断更新资源深度学习、机器学习、数据分析、python搜索公众号添加: ......