《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS

时间：2022-11-18 16:48:31浏览次数：52

标签：selfish 狩猎选择代理人 2018 AAMAS 猎鹿 agents 收敛

环境：

猎鹿博弈(即代理人要么选择有风险的合作政策，单独代理人选择会导致低收益；要么选择一个安全的合作政策，无论怎么样都会有安全收益)存在多个纳什均衡的环境

h > c >=m > g
创新点：
- 目标：最终收敛到狩猎均衡获得更高收益，而不是低收益的均衡
- 采用亲社会代理人机制，代理人考虑伙伴的奖励采取动作
  
  其中参数代表代理人的亲社会水平，当参数超过临界值后可以逐渐增加收敛后的社会总收益(定理)
- 设计出发点：假设每个代理人都有一个信念值p代表期待伙伴选择狩猎的概率，代理人之间会对这种信念值做出回应，如果伙伴选择了狩猎，那么p值就会上升。
  
  由此可以找到p的临界值
适用环境有限，如果不是类似猎鹿博弈的环境中，可能会收敛到次优解

标签：selfish,狩猎,选择,代理人,2018,AAMAS,猎鹿,agents,收敛
From： https://www.cnblogs.com/e557/p/16903701.html

2018年辽宁省电子设计大赛D题手势识别装置
一转眼，两年过去了。距离这个比赛已经好久。我此时（2020年5月28日）已然大四，马上要念研究生了。现在回头看这篇我刚开始接触写的文章，还没有学会markdown，而且认识也比较粗浅。大......
2018-11-8-内置函数(2)
主要内容一.1.locals()2.globals()3.complex4.binocthex5.abs6.divmod7.round8.pow(x,y,z=1)9.sum10.min/max11.reversed12.slice13.format14.bytes15.bytearray16.memory......
LG_P4588 [TJOI2018] 数学计算题解
LuoguP4588题解这个玩意还是挺好想到的，也不难看出他是一个线段树。没想到可以评上蓝。考虑每次操作对于答案的贡献。由于\(x=1\)，所以我们相当于是在维护一堆数的积，初始......
luogu P4786 [BalkanOI2018]Election
题面传送门离谱题，结论出奇的简单。首先我们考虑\(O(nq)\)怎么做。显然所有C都要放在最终序列中，然后问题就变成往里面填T。我们考虑第一个T填在能填的最开始的位置上，因......
P5017 NOIP2018 普及组摆渡车
P5017NOIP2018普及组摆渡车-洛谷|计算机科学教育新生态(luogu.com.cn)显然要把人按照到达时间排序。然后考虑dp。设\(f(i)\)表示前\(i\)个人已上车或到达目......
NEO与以太坊：为什么NEO可能是2018年最强的加密货币
NEO，它可以与以太坊竞争吗？NEO和以太坊你会下重注投资其中的哪一个？ 2013年年末，以太坊创始人VitalikButerin（V神）发布了以太坊初版白皮书，启动了项目。2014年7月24日起，以太坊......
2018之后的Unity3d制作AR教程
自2017.4以后的unity版本，AR的SDK已经被集成，那么如何用2018unity3d制作AR呢？1.首先打开Unity3d2018,然后打开File->BuildingSetting，接着打开PlayerSetting,找到XRSetting......
Nexus RCE CVE-2018-16621/CVE-2020-10204
POST/service/extdirectHTTP/1.1Host:xxxxxxxxxUser-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64;rv:106.0)Gecko/20100101Firefox/106.0Accept:*/*Accep......
PS滤镜Nik Collection 2018 for mac中文版合集 v1.2.15汉化版
ps滤镜NikCollection2018formac中文版是一个大合集，NikCollectionformac这是一款Mac平台的强大的作图插件套装，内含全部Nik的6个针对Photoshop、Lightroom和Aperture......
《神经网络与深度学习》最新2018版中英PDF+源码
机器学习AI算法工程公众号：datayx资料获取1.关注微信公众号datayx 然后回复深度学习即可获取。不断更新资源深度学习、机器学习、数据分析、python搜索公众号添加： ......

《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS

环境：

相关文章

赞助商

阅读排行