PoliFormer

2024-11-11PoliFormer：使用 Transformers 扩展策略在线 RL，打造熟练导航员
24年6月来自西雅图AI2的论文“PoliFormer:ScalingOn-PolicyRLwithTransformersResultsinMasterfulNavigators”，获得CoRL‘24最佳论文之一。POLIFORMER（策略Transformer），这是一个仅限RGB的室内导航智体，通过大规模强化学习进行端到端训练，尽管纯粹在模拟中训练，但它