首页 > 其他分享 >RoboTAP笔记

RoboTAP笔记

时间:2023-11-26 15:47:25浏览次数:36  
标签:TAPIR 演示 笔记 视觉 运动 RoboTAP

title: RoboTAP笔记
banner_img: https://drive.studyinglover.com/api/raw/?path=/photos/blog/background/1679396994125.png
index_img: https://cdn.studyinglover.com/pic/2023/08/15ff4915dff842e47e91d580d0d0fe5c.png
date: 2023-9-1 12:35:00
categories:
- 笔记
tags:
- 多模态

RoboTAP笔记

RoboTAP是一种基于点追踪技术的少样本视觉模仿方法,可以实现机器人在多个任务和场景中的精准操作。

项目主页GitHub

RoboTAP不需要任何特定于任务的训练或神经网络微调。由于TAP的普适性,作者发现添加新任务(包括调整超参数)只需几分钟,这比我们熟悉的任何操纵系统都快几个数量级。作者认为这种能力在大规模自主数据收集和作为解决现实任务的解决方案方面可能非常有用。RoboTAP在需要快速教授视觉运动技能并且可以轻松演示所需行为的情况下最有用。

RoboTAP存在一些重要的限制。首先,低级控制器是纯视觉的,这排除了复杂的运动规划或力控制行为。其次,目前计算运动计划一次并在没有重新规划的情况下执行它,这可能会导致单个行为失败或环境意外改变。

作者在论文中指出他有四个贡献

  1. 在密集跟踪方面制定多任务操作问题
  2. RoboTAP的具体实现是什么,在哪里以及如何以visual-saliency,temporal-alignment, 和 visual-servoing的形式解决问题
  3. 一个新的密集跟踪数据集,其中包含为RoboTAP任务量身定制的ground-truth人工注释,并在专注于真实世界机器人操作的TAP-Vid基准上进行评估
  4. 描述了RoboTAP在涉及精确多体重排、变形物体和不可逆行动的一系列操作任务中的成功和失败模式的实证结果。

image.png

RoboTAP方法的核心是利用TAPIR密集地跟踪一组演示,将演示分段,并自动发现每个阶段的活动点集q,该点集覆盖在该动作阶段相关的物体上。然后,我们形成一个可以在机器人上执行的运动计划,其中包括模仿视觉运动和基本的电机原语,例如关闭和打开夹爪的阶段。通过使用TAPIR检测点q,找到最近的演示,显示如何移动这些点,并找到可以用作运动目标的单个附近帧来实现视觉伺服。将目标帧(g)和在线TAPIR检测之间的位移用作经典视觉伺服的运动目标,从而产生出奇异复杂和强健的行为。

标签:TAPIR,演示,笔记,视觉,运动,RoboTAP
From: https://www.cnblogs.com/studyinglover/p/17857337.html

相关文章

  • Paper Gestalt笔记
    title:PaperGestalt笔记banner_img:https://cdn.studyinglover.com/pic/2023/07/5deff473fdf93539d3952d3d6894add3.pngdate:2023-7-2710:57:00PaperGestalt笔记最近读到了一篇CVPR2010非常优秀的论文,叫做PaperGestalt,他考虑到近年来(2010年的近年来)CVPR的投稿两......
  • LoRA笔记
    title:LoRA笔记banner_img:https://proxy.thisis.plus/202305091237913.pngdate:2023-6-130:12:40tags:-文字生成图片LoRA笔记自然语言处理的一个重要范式包括对一般领域数据的大规模预训练和对特定任务或领域的适应。当我们预训练更大的模型时,重新训练所有模型参数......
  • Imagic笔记
    title:Imagic笔记banner_img:https://drive.studyinglover.com/api/raw/?path=/photos/blog/background/1679397008541.pngdate:2023-3-2919:42:00categories:-笔记tags:-文字生成图片Imagic笔记先前的工作大多数方法目前仅限于以下一种:特定的编辑类型(例如,对象叠......
  • LISA(推理分割)笔记
    title:LISA(推理分割)笔记banner_img:https://cdn.studyinglover.com/pic/2023/08/10f885319b150cc20093124185e25c3b.pngindex_img:https://cdn.studyinglover.com/pic/2023/08/ded90e7e3f84739b187dd679c39bd8dd.pngdate:2023-8-1815:05:00categories:-笔记tags:-......
  • 进程间通信--学习笔记
    #进程间通信--pipe、FIFO、共享内存、消息队列、信号量pipe(无名管道)​ 只能实现有亲缘关系进程之间的通信,它是单向的,intpipe(intpiped[2])//创建管道fd[0]:读文件,fd[1]:写文件。之后可以用open()、write()函数进行对管道进行操作,创建管道要在fork()之前以保证......
  • 《信息安全系统设计与实现》第十二周学习笔记
    TCP/IP协议TCP/IP协议是一组通信协议,用于在计算机网络上实现数据传输。它是因特网的基础协议,也被广泛用于局域网(LAN)和广域网(WAN)。TCP/IP协议族由两个主要协议组成:传输控制协议(TCP)和互联网协议(IP)。这两个协议共同工作,以确保在网络上可靠、有序地传输数据。IP主机和IP地址:IP地......
  • 学习笔记11
    第十四章MYSQL实践mysql简介MySQL是一个开源数据库管理系统,由服务器和客户机组成。在将客户机连接到服务器后,用户可向服务器输入SQL命令,以便创建数据库,删除数据库,存储、组织和检索数据库中的数据。MySQL有广泛的应用。mysql安装在ubuntu中使用sudoaptinstallmysql-server......
  • I3D笔记
    title:I3D笔记banner_img:https://drive.studyinglover.com/api/raw/?path=/photos/blog/background/1679397045791.jpgdate:2023-4-2322:14:00I3D笔记I3D是一个视频理解模型,采用双流网络的架构,他的核心贡献是提出了如何对2d网络进行膨胀操作,同时提出了一个新的数据集Ki......
  • DSDN笔记
    title:Dual-StreamDiffusionNetforText-to-VideoGeneration笔记banner_img:https://cdn.studyinglover.com/pic/2023/08/b6f940f512488c10b7a1bf40eb242cae.pngindex_img:https://cdn.studyinglover.com/pic/2023/08/3021b6624ee4f2093c6166b6a80cd643.pngdate:2023......
  • DINO-v2笔记
    title:DINO-v2笔记banner_img:https://cdn.studyinglover.com/pic/2023/07/b5c4ecf9aa476ca1073f99b22fe9605e.jpgdate:2023-7-270:04:00categories:-文字生成图片DINO-v2笔记DINO-v2一种无监督学习的预训练方法,可以生成具有强大泛化能力的视觉特征,适用于各种图像分布......