Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting Pot

时间：2022-11-03 23:57:39浏览次数：71

标签：Melting Multi Pot 学习智能强化评估

提出的问题：

现有的对多智能体强化学习的评估工具没有将多智能体强化学习泛化的新情况评估作为主要目标。
传统的监督学习和受益于明确的实验环境和存在的评价基准，能够较为简单的进行评估，但是对于强化学习来说，生成一组测试环境比标记一组测试数据所需要的资源消耗是要更多的。

解决方案及创新：

提出了名为Melting Pot的评估工具包括一种评估方法和一套特定的测试环境，填补了上述的评估方面的空白能够在使用强化学习的基础上耗费较少的资源对多智能体强化学习进行评估，揭示一些在训练性能中无法发现的弱点。专注于为多智能体强化学习泛化提供一个基准。

Substrate：世界的物理部分即地图布局、物体分布、移动方式、物理规则
Background：代表部分模拟部分具有智能体的仿真场景
利用多智能体之间的交互创建大量的泛化测试集，具体来说就是预训练智能体的“背景群体”用作后续的评估，不作为训练数据。
Melting Pot相关定义：
- substrate：指代部分可观察的马尔科夫博弈，在游戏状态中每个代理不知道游戏规则，必须探索才能得到。

标签：Melting,Multi,Pot,学习,智能,强化,评估
From： https://www.cnblogs.com/e557/p/16856297.html

A Framework for Multiple-Instance Learning的复现与思考
思考1.任何都是基于假设去处理数据。本文的假设就是出现一点在正包的交点中。假设是正包交于一点且该点距离所有的包距离最短。遇到的问题:1.我想找一点尽可能降低该点......
git clone https://chromium.googlesource.com/chromium/tools/depot_tools 下载时超
解决方案1我这里使用的是极光，端口是......
Multisim14数据库下载
Multisim14访问主数据库失败的解决方法。点击下载访问密码:2077将文件解压到C盘，合并文件夹。数据库应该是通用的，其他版本也可以试试。......
【五期杨志】CCF-A(NeurIPS'20) Self-supervised multimodal versatile networks
AlayracJB,RecasensA,SchneiderR,etal.Self-supervisedmultimodalversatilenetworks[J].AdvancesinNeuralInformationProcessingSystems,2020,33:2......
【XSY3513】Multiple of Nine（状压DP）
题意：转化后变为：给一张\(n\)个点的图，你需要给每个点染上\([1,k]\)中的某个颜色，图上有\(m\)条边，每条边\((u,v)\)有两种边权\(w_1\)（当\(u,v\)颜色相同时）和\(w_2\)......
Python multiprocessing 多进程间通信传递DataFrame的方法
进程是资源的集合，是最小的资源单位。是一个程序在一个数据集上的一次动态执行过程。进程一般由程序、数据集、进程控制块三部分组成。多进程适合执行计算密集型任务（如：视频......
【Swift 60秒】33 - Exiting multiple loops
0x00LessonIfyouputaloopinsidealoopit’scalledanestedloop,andit’snotuncommontowanttobreakoutofboththeinnerloopandtheouter......
为什么有时候某函数明明只写了一次，gcc和ld却报错 “multiple definition” ?
最主要的可能：你在头文件里写了非staticinline的函数定义（注意定义和声明的区别）有函数体的函数->定义，而非声明有初始化的全局变量->定义，而非声明原因：1.有可能是......
借用【.bat 批处理】实现同时播放多个视频 · 以PotPlayer播放器为例
突然有这样的需求：同时打开一个文件夹下的多个视频播放任务。如何来实现呢？理所当然的是想到Potplayer本身可以开多个进程，也就是多开窗口播放，但是经过实验，发现在资源管理器......
YeYuan-2021-AgentFormer-AgentAwareTransformers for Socio-Tempolar Multi-Agent Fo
#AgentFormer:Agent-AwareTransformersforSocio-TemporalMulti-AgentForecasting#paper1.paper-info1.1MetadataAuthor::[[YeYuan]],[[XinshuoWeng]],......

Scalable Evaluation of Multi-Agent Reinforcement Learning with Melting Pot

提出的问题：

解决方案及创新：

相关文章

赞助商

阅读排行