首页 > 其他分享 >[Paper Reading] HPT: Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transform

[Paper Reading] HPT: Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transform

时间:2024-10-11 21:15:17浏览次数:1  
标签:Pre Transformers trained Visual Learning trunk Heterogeneous

目录

Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers

Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers
时间:24.09
机构:MIT&Meta
主页:https://liruiw.github.io/hpt/

TL;DR

由于具身智能在各种本体(例如摆放、Sensor多样性)与任务上泛化性是目前具身智能的一个难点问题,本文通过提出HPT(Heterogeneous Pre-trained Transformers),一种共享Policy NN的Trunk部分预训练参数,来解决该问题。实验证明这种方法在真实与仿真场景下能提升20%的效果。

Method

将一个Policy NN模型定义为stem, trunk, head三部分

Stem

a proprioceptive tokenizer(本体感受) and a vision tokenizer(ResNet backbone),整体参数量占比少。

Trunk

the number of trunk parameters is fixed independent of the number of embodiments and tasks

Loss

In the pre-training stage, only the trunk parameters are updated at every iteration, and the stems and heads for each heterogeneous embodiment and task are updated based on the training batch sampling.

预训练的主体部分,其输入与输出sequence长度是固定的,根据embediements与task来决定使用哪个stem与head。

在多种训练集混合训练中,仅trunk是每个sample都会更新,而head与stem是否更新取决于数据集。

takes as input the pooled feature of the trunk and outputs a normalized action trajectory. The policy head is reinitialized for transferring to a new embodiment.


Experiment


从下面这张图看,Finetuned相对于FromScratch确实有20%以上涨幅度了。

训练资源

The compute resources for these pre-training experiments range from 8 V-100s to 128 V-100s and the training time spans from
half a day to 1 month. The total dataset disk size is around 10Tb and the RAM memory requirement is below 50Gb.

效果可视化

https://liruiw.github.io/hpt/

总结与发散

异构性指得是机器人类型、任务 以及 环境多样性,核心是解决泛化性问题

相关链接

引用的第三方的链接

资料查询

折叠Title FromChatGPT(提示词:XXX)

标签:Pre,Transformers,trained,Visual,Learning,trunk,Heterogeneous
From: https://www.cnblogs.com/fariver/p/18452260

相关文章

  • express的使用笔记 2 请求对象与响应对象 、 增删改查demo
    Express不对Node.js已有的特性进行二次抽象,只是在它之上扩展了web应用所需的基本功能。内部使用的依旧是http模块,请求对象继承字http.IncomingMessage,响应对象继承自http.ServerResponse,所以node.js官网中的对应的方法可以通用1.请求对象2.响应对象除了response.send(),resp......
  • 2024 最新 Navicat Premium 17.1.5 简体中文版(亲测可用)
    步骤如下:一、官网下载安装包:https://www.navicat.com.cn/download/navicat-premium  二、安装NavicatPremium17  注意:安装完后不要打开已打开自行退出三、补丁下载关注后发送“navicat17”即可获取补丁下载地址,无套路。 四、安装补丁先将下载下来的压缩包里面......
  • 界面控件DevExpress WinForms v24.1新版亮点 - 可访问性和UI自动化增强
    DevExpressWinForms拥有180+组件和UI库,能为WindowsForms平台创建具有影响力的业务解决方案。DevExpressWinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任!DevExpressWinForms控件v24.1日前已经全新发布,新......
  • Navicat Premium v17 中文注册版
    Navicat是一款强大的数据库管理和开发工具,它支持多种数据库系统,包括MySQL、MariaDB、Oracle、PostgreSQL、SQLite和SQLServer等。Navicat提供了一个直观的用户界面,使得用户可以轻松地创建、组织、访问和共享数据库信息。该版本已注册,可以使用全部功能。使用说明:1、......
  • wordpress网站 建立数据库连接出错
    WordPress网站在建立数据库连接时出错通常是由以下几个原因造成的:配置文件错误:检查 wp-config.php 文件中的数据库配置信息是否正确,包括数据库主机名、用户名、密码、数据库名称等。数据库服务器未运行:确保MySQL或其他数据库服务正在运行,并且可以从Web服务器访问。数据......
  • express 的使用笔记1
    官网地址:http://expressjs.com/zh-cn/starter/installing.html1.安装与启动1)首先要有node环境,作为一个前端开发,肯定已经有啦,那就直接开一个项目demo,然后安装express,如下图:2)上面操作之后,项目文件里应该会有一个app.js入口文件,如果没有,则可以借用gitbash使用touchapp.js来创......
  • DevExpress WPF中文教程:如何解决数据更新的常见问题?
    DevExpressWPF拥有120+个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpressWPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。无论是Office办公软件的衍伸产品,还是以数据为......
  • JavaScript Number研究03_实例方法_toExponential_toFixed_toPrecision_toString_valu
    JavaScriptNumber研究03:实例方法——toExponential、toFixed、toPrecision、toString、valueOf、toLocaleString在JavaScript中,Number对象不仅包含了许多有用的静态属性,还提供了一系列实例方法,帮助我们在不同场景下处理和转换数值。这些方法包括:toExponential()toFixed()......
  • Microsoft Expression Studio 4 MSDN中文旗舰版
    MicrosoftExpressionStudio4MSDN中文旗舰版复制   slice UID79171帖子5494PB币19816贡献0技术64活跃1938   楼主 发表于2010-10-1021:42:52 IP属地重庆本帖最后由slice于2010-10-1021:47编辑cn_expression_st......
  • DevExpress WPF中文教程:如何解决数据更新的常见问题?
    DevExpressWPF拥有120+个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpressWPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。无论是Office办公软件的衍伸产品,还是以数据为中心......