首页 > 其他分享 >Hierarchical Cross-Modal Agent forRobotics Vision-and-Language Navigation论文的复现

Hierarchical Cross-Modal Agent forRobotics Vision-and-Language Navigation论文的复现

时间:2024-11-04 14:45:21浏览次数:6  
标签:requirements Language habitat vln python Cross Agent robo install

GitHub - GT-RIPL/robo-vln: Pytorch code for ICRA'21 paper: "Hierarchical Cross-Modal Agent for Robotics Vision-and-Language Navigation"

Installation

git clone https://github.com/GT-RIPL/robo-vln
cd robo-vln
  
export robovln_rootdir=$PWD
    
git submodule init 
git submodule update

Habitat and Other Dependencies

conda create -n habitat python=3.6 cmake=3.14.0
cd $robovln_rootdir
python -m pip install -r requirements.txt

注意:这篇论文中需要的habitat依赖为habitat-lab和habitat-sim是0.1.5版本如果下述安装失败可以去寻求gpt找安装0.1.5的方法

# installs both habitat-api and habitat_baselines
cd $robovln_rootdir/environments/habitat-lab
python -m pip install -r requirements.txt
python -m pip install -r habitat_baselines/rl/requirements.txt
python -m pip install -r habitat_baselines/rl/ddppo/requirements.txt
python setup.py develop --all
	
# Install habitat-sim
cd $robovln_rootdir/environments/habitat-sim
python setup.py install --headless --with-cuda

数据集下载:

GitHub - GT-RIPL/robo-vln: Pytorch code for ICRA'21 paper: "Hierarchical Cross-Modal Agent for Robotics Vision-and-Language Navigation"结果为:

(视频是跑出来的)

(只要mp3d数据集)

单纯的评估结果:

(大约需要评估20小时左右)

视频:

遇到问题:

标签:requirements,Language,habitat,vln,python,Cross,Agent,robo,install
From: https://blog.csdn.net/weixin_46943094/article/details/143484394

相关文章

  • HE-Drive:Human-Like End-to-End Driving with Vision Language Models
    文章目录前言一、介绍二、相关工作2.1端到端自动驾驶2.2用于轨迹生成的扩散模型2.3用于轨迹评估的大型语言模型(LLMs)三、方法论3.1稀疏感知3.2基于扩散的运动规划器3.3基于大语言模型的轨迹评分器3.3.1基于规则的轨迹评分策略3.3.2VLMs帮助调整驾驶风格。3.4......
  • 论文阅读《SpotServe:Serving Generative Large Language Models》
     记录我在本科期间的论文阅读笔记,可能有些地方理解的不对,理性看待哈!SportServe:在抢占式实例上为生成式大型语言模型服务摘要LLM(大型语言模型)具有非常高昂的计算代价,所以降低他们的成本非常具有挑战性,本文利用云服务上的可抢占式的GPU实例来降低成本,但要解决频繁的实例抢......
  • NLP论文速读|DDCoT: Duty-Distinct Chain-of-Thought Prompting for Multimodal Reaso
    论文速读|Duty-distinctchain-of-thoughtpromptingformultimodalreasoninginlanguagemodels论文信息:简介:   论文探讨了如何使大型语言模型(LLMs)在多模态环境中进行复杂的推理,这一直是人工智能系统的长期目标。尽管最近的研究表明,通过模仿人类思维过程的“......
  • Autodesk Maya 2025.3 Multilanguage (macOS, Windows) - 三维动画和视觉特效软件
    AutodeskMaya2025.3Multilanguage(macOS,Windows)-三维动画和视觉特效软件三维计算机动画、建模、仿真和渲染软件请访问原文链接:https://sysin.org/blog/autodesk-maya/查看最新版。原创作品,转载请保留出处。作者主页:sysin.org三维计算机动画、建模、仿真和渲染软件......
  • LLM | 论文精读 | 地学视觉语言大模型:Towards Vision-Language Geo-Foundation Model:
    论文标题:TowardsVision-LanguageGeo-FoundationModel:ASurvey作者:YueZhou,LitongFeng,YipingKe,XueJiang,JunchiYan,XueYang,WayneZhang期刊:未提供DOI:https://arxiv.org/abs/2406.09385email:[email protected]创作不易,恳请大家点赞收藏支持:)论......
  • 论文阅读Nature:Detecting hallucinations in large language models using semantic e
    论文阅读-Nature:Detectinghallucinationsinlargelanguagemodelsusingsemanticentropy(使用语义熵来检测大模型中的幻觉)作者:SebastianFarquhar,JannikKossen,LorenzKuhn&YarinGal单位:牛津大学,计算机科学学院,OATML实验室期刊:Nature时间线:2023年7月提交→......
  • PromQL (Prometheus Query Language)进阶教程
    PrometheusQueryLanguage典型应用场景:在仪表板中可视化Prometheus数据、使用Prometheus的警报管理器构建警报规则等。了解如何构建PromQL是使用Prometheus的一项基本技能,通过上篇文章学习了基础知识,本文带你更深入学习并实践。Prometheusmetrics类型我们已经知道,Promet......
  • 如何理解RAG的尽头是Agent
    理解“RAG的尽头是Agent”这一观点,需要从检索增强生成(Retrieval-AugmentedGeneration,RAG)和智能代理(Agent)这两个概念的演进和融合来分析。什么是RAG?RAG是一种将大型语言模型(LLM)与外部知识库相结合的框架。在返回内容生成过程中,模型不仅依赖于训练数据,还能实时检索相关信......