首页 > 其他分享 >Open X-Embodiment: Robotic Learning Datasets and RT-X Models

Open X-Embodiment: Robotic Learning Datasets and RT-X Models

时间:2024-10-10 19:21:51浏览次数:3  
标签:RT Datasets Embodiment 泛化 训练 模型 机器人 数据

Open X-Embodiment: Robotic Learning Datasets and RT-X Models

启发:在不同数据集上训练大规模、高容量模型以处理下游应用方面取得显著成功。是否能将所有数据整合在高容量机器人操作模型上使其有效适应新的机器人、任务、环境?
贡献:提供了标准化数据格式和模型的数据集,收集了来自22个不同机器人的数据集,展示了527项技能(160266项任务),在该数据上训练了高容量模型RT-X,利用其他平台的经验提高多个机器人的能力。

介绍

  • 通常在大型和多样化的数据集上训练的大规模通用模型往往能够超过在较小但更多任务特定的数据上训练的狭义通用模型。
  • 通用策略很难应用于机器人领域:机器人操作是物理交互、图像、语言等复杂领域的融合;交互数据收集由于硬件成本和采集效率低下难以构建超大型数据集;过去,由于各个数据集的环境、任务设置、机器人类别的不同,没有提出有效的数据联合方法弥补单个数据集过于狭隘的缺陷,本文的主要贡献就在于提出了相关的解决方案。

在这里插入图片描述

相关工作

  • 跨实体转移:共享动作表示;融合表示学习目标;在具身信息上调整学习到的策略;解耦机器人和环境表示;从人类视频数据中学习可迁移的奖励函数、目标、动力学模型或视觉表示。本文没有针对域迁移的相关机制。
  • 大型机器人学习数据集:将大量先验数据集处理和聚合成一个单一、标准化的存储库,以一种有意义和有用的方式共享机器人学习数据集。
  • 语言条件机器人学习:使用大规模的多具身示范数据,通过模仿学习来训练语言条件政策,在预训练语言嵌入和预训练视觉语言模型的工作基础上进行了研究。参考RT1和RT2。

RT-X

数据集概述

在这里插入图片描述

模型设计

数据格式合并

不同机器人的观察空间和动作空间存在显著差异。将输入图像简单调整到共同的分辨率,将原始动作集转换为7Dof末端执行器动作并执行归一化和离散化,在执行策略时,根据具体设置去标准化。

控制策略架构

在这里插入图片描述
本文考虑了两个模型架构:RT-1和RT-2,两种架构都以256个bins构成的7维动作空间构成(6-Dof和夹爪状态)作为输出,将预测输出根据数据集实际设置去标准化后进行训练,若某维度没有被利用则置为0。具体架构和训练过程参考原文。

实验结果

协同训练是否可以提高训练任务的性能?

对于小数据集,期望显著提升性能;对于大数据集,期望提升挑战性任务执行性能。
评估基准:原作者利用原始数据集在原始模型上训练;在原始数据集上训练RT-1模型。
在这里插入图片描述
在小数据集上,RT-1-X均高于RT-1,说明联合训练有助于提升性能。

对于大规模数据集,RT-1-X发生欠拟合,用更大模型容量的RT-2-X优于原始模型。

任务泛化能力有无增强?

在这里插入图片描述

  • 对未知对象、背景、环境的泛化:RT-2和RT-2-X性能相差不大。
  • 知识在机器人间传递:RT-2-X相比RT-2提高了3倍,协同任务训练提高了原已有大型数据集支撑的模型泛化能力,这种提升可能是在另一个数据集中训练相似任务带来的。
模型大小、架构、数据集组成等设计对结果的影响?
  • 包含短历史图像显著增强了泛化性能;基于Web的模型预训练至关重要;更高的模型容量可以实现更高的迁移程度。

标签:RT,Datasets,Embodiment,泛化,训练,模型,机器人,数据
From: https://blog.csdn.net/CHONGjjj/article/details/142825133

相关文章

  • Cortex-M3/M4/M7 芯片 Fault 分析原理与实战
    目录一、简介1、异常类型2、异常优先级3、同步异步问题4、异常具体类型二、Faultexceptionregisters1、Controlregisters1.1CCR1.2SHP1.3SHCSR2、Statusandaddressregisters2.1HardFaultStatusRegister——HSFR2.2ConfigurableFaultStatusRegister——......
  • [Java/Spring] 深入理解 : Spring BeanFactory / ApplicationContext、Environment、P
    PropertySource:解析环境资源及配置的底层组件org.springframework.core.env.PropertyResolverEnvironment:管理环境的配置与资源org.springframework.core.env.Environment其继承接口PropertyResolver属性解析器,用来解析不同属性源PropertySource里的key......
  • 【刷题笔记】[ABC281G] Farthest City
    【刷题笔记】[ABC281G]FarthestCity题意求构造一个没有重边和自环【简单联通】的无向连通图,使得\(d[n]\)严格大于\(d[i]\),问有几种构造方案思路一道\(DP\)好题\(DP\)有\(2\)种题型,求最优值问题,和计数问题。本题为计数问题。因为在边权为1的最短路中\[d[i]=d[i-1]+1\]所......
  • AT_abc283_g [ABC283G] Partial Xor Enumeration 题解
    题目传送门前置知识线性基解法考虑线性基。因为有可空子序列也参与运算,所以第\(1\)小的数是\(0\);但线性基中是不允许有异或和为\(0\)的存在,故线性空间内第\(k-1\)小的数就是所求的第\(k\)小的数。令每一个二进制位仅在它这一位的基底上出现,其他位上的基底直接异或......
  • 获取pytdx行情服务器ip和port
    之前一直用的api.connect('124.71.187.122',7709)突然不能用了,调查了一下,给出如下解决方案打开通达信客户端,选项->通讯设置。勾掉"登录时查找最快的主站",手动选择"行情主站",点确定。点击"选项"中的"断开行情主站",再点"连接行情主站"。打开windows任务管理器,找到通达信进程......
  • [Javascript] Proxy vs defineProperty in low level
    ProxyThe Proxy objectenablesyoutocreateaproxyforanotherobject,whichcaninterceptandredefinefundamentaloperationsforthatobject. Sowhatdoesitmeanfor fundamentaloperationsforobject?Injavascript,wecandofollowingopeartio......
  • Camstar 电子套件基础数据导入导出Export/Import
    前提准备:你的共享目录CamstarUploads弄好了,参考https://www.cnblogs.com/CarryYou-lky/p/16133849.html     ......
  • clock uncertainty和clock skew
    首先查看一下两者的定义:1,时钟不确定性(ClockUncertainty):是指在给定时间点上,某个时钟信号可能存在的不确定性范围。它通常是由于信号传播延迟、设备响应时间、时钟抖动等导致的。这种不确定性关注的是在做出时间测量时,设备时间值的准确性和可靠性。uncertainty=jitter+skew。2......
  • prometheus学习笔记之进程监控process_exporter
    项目地址:https://github.com/ncabatoff/process-exporter一、安装process-exporterhttps://github.com/ncabatoff/process-exporter/releases/download/v0.8.3/process-exporter-0.8.3.linux-amd64.tar.gztarxfprocess-exporter-0.8.3.linux-amd64.tar.gzmvprocess-expo......
  • import mindnlp报错:OSError: cannot load library ‘libsndfile.so‘: libsndfile.so:
    在启智平台AI调试环境下,安装mindnlp后,importmindnlp报错。安装mindnlp命令:#安装mindnlp的daily包,待正式发布后可改为直接安装mindnlp包!pipinstallhttps://mindspore-courses.obs.cn-north-4.myhuaweicloud.com/mindnlp/mindnlp-0.4.0-py3-none-any.whl-ihttps://pypi.......