网站首页
编程语言
数据库
系统相关
其他分享
编程问答
NaVid
2024-12-28
RSS-2024 | 具身智能体也爱看片!NaVid:视觉语言导航智能体通过视频学习导航动作规划
作者:JiazhaoZhang,KunyuWang,XiaomengFang,RongtaoXu,QiWu,GengzeZhou,ZhizhengZhang,YicongHong,HeWang,单位:中国科学技术大学计算机科学与工程学院,北京人工智能研究院,CASIA,阿德莱德大学,澳大利亚国立大学,Galbot原文链接:NaVid:Video-basedVLMPlans