网站首页
编程语言
数据库
系统相关
其他分享
编程问答
导航员
2024-11-11
PoliFormer:使用 Transformers 扩展策略在线 RL,打造熟练导航员
24年6月来自西雅图AI2的论文“PoliFormer:ScalingOn-PolicyRLwithTransformersResultsinMasterfulNavigators”,获得CoRL‘24最佳论文之一。POLIFORMER(策略Transformer),这是一个仅限RGB的室内导航智体,通过大规模强化学习进行端到端训练,尽管纯粹在模拟中训练,但它