网站首页
编程语言
数据库
系统相关
其他分享
编程问答
NWM
2024-12-09
世界模型爆发!Meta FAIR 的 Yann LeCun 团队继 World Labs(李飞飞)、谷歌 DeepMind后加入战场!《Navigation World Models》
论文地址项目地址Abstract导航是具有视觉运动能力的智能体的基本技能。我们介绍了导航世界模型(NWM),一个可控的视频生成模型,预测未来的视觉观察的基础上,过去的观察和导航行动。为了捕捉复杂的环境动态,NWM采用了条件扩散Transformer(CDiT),在人类和机器人代理的各种自我中