网站首页
编程语言
数据库
系统相关
其他分享
编程问答
AAMAS
2023-01-07
《Adaptive Incentive Design with Multi-Agent Meta-Gradient Reinforcement Learning》 2022-AAMAS
多智能体元梯度强化学习的自适应激励设计总结:提出了一种基于元梯度的多智能体强化学习自适应奖励机制,解决了较为复杂的多智能体强化学习下的奖励机制问题,最终证明该方法
2023-01-06
《Quantifying the effects of environment and population diversity in multi-agent reinforcement learni
量化多智能体强化学习中环境和种群多样性的影响总结:在多种实验环境下评估多智能体强化学习受到环境多样性以及智能体多样性的影响,主要是泛化能力实验过程主要是通过改
2022-12-23
《Social Diversity and Social Preferences in Mixed-Motive Reinforcement Learning》 2020-AAMAS
混合动机强化学习中的社会多样性与社会偏好总结:本质是在研究当智能体群体中的个体具有独特性质时在困境强化学习中对结果的影响。提出了一个社会价值偏向取向的概念来使
2022-12-10
《Emergent Cooperation from Mutual Acknowledgment Exchange》 2022-AAMAS
从相互交换确认中产生合作总结:为了改进传统的激励其他代理人机制,其存在隐私侵犯的问题,文中提出一种两阶段的请求和回应机制,即即使想要激励其他人送出的东西还需要得到
2022-11-26
《Learning to Resolve Alliance Dilemmas in Many-Player Zero-Sum Games》 2020-AAMAS
学习解决多人零和博弈中的联盟困境总结:将两人的零和博弈扩展到多人零和博弈,并将多人零和博弈中的联盟问题转为社会困境问题用基于强化学习的方法进行解决。先是说明了一
2022-11-18
《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS
环境:猎鹿博弈(即代理人要么选择有风险的合作政策,单独代理人选择会导致低收益;要么选择一个安全的合作政策,无论怎么样都会有安全收益)存在多个纳什均衡的环境h>c>=m>