首页 > 其他分享 >Deep Dynamics Models for Learning Dexterous Manipulation

Deep Dynamics Models for Learning Dexterous Manipulation

时间:2023-04-30 13:44:18浏览次数:33  
标签:动作 Models Dexterous models planning Deep online model


发表时间:2019 (CoRL 2019)
文章要点:文章提出了一个online planning with deep dynamics models (PDDM)的算法来学习Dexterous multi-fingered hands,大概意思就是学习拟人的灵活的手指操控技巧。大概思路就是结合uncertainty-aware neural network models和gradient-free trajectory optimization,先学习dynamics models,然后用online model-predictive control来选择动作。
具体的,先假设状态转移是个高斯分布

然后用ensembles的方式学习多个model来度量model uncertainty。
对于online planning这块,作者在Random Shooting和cross-entropy method (CEM)的基础上,多考虑了和时间步相关的协方差(considers covariances between time steps),然后用softer update rule来更新。具体的,CEM通过采用的方式得到动作序列,然后选取最好的J个动作来更新均值和协方差,然后通过更新的估计进行下一轮的动作选择。

作者用的方式多加入了时间的平滑,

另外,在采样动作的时候不用random policy来做,而是用一个平滑化的方法来选择动作,这个平滑项n通过噪声的方式加到之前学到的\(\mu\)上,有点时间序列的意思

总结:方法虽然很常规,但是效果还是很好的。而且有模拟有实物,不好做的。
疑问:其实不是很明白为什么online planning去学均值和方差的时候要和time steps产生关系,为了让动作序列更加平滑?难道这就是使得机械臂产生拟人动作的关键吗,这样就不会产生波动很大的动作了?

标签:动作,Models,Dexterous,models,planning,Deep,online,model
From: https://www.cnblogs.com/initial-h/p/17365192.html

相关文章

  • 模型层(models层) -- ORM
    目录Django模型层之ORM介绍sqlite3数据库pycharm查看sqlite3文件Navicate连接sqlite3测试环境的搭建单表操作单表的增删改查常见的十几种查询方法查看原生SQL语句query属性在settings中配置LOGGING日志基于双下划线查询多表查询之表关系操作一对多的外键增删改查数据多对多外键增......
  • Cluster-GCN An Efficient Algorithm for Training Deep Convolution Networks
    目录概符号说明MotivationCluster-GCN代码ChiangW.,LiuX.,SiS.,LiY.,BengioS.andHsiehC.Cluster-GCN:Anefficientalgorithmfortrainingdeepandlargegraphconvolutionalnetworks.KDD,2019.概以往的GraphSage,FastGCN等方法,虽然能够实现mini-b......
  • Quartus Prime-can't launch the ModelSim software 的解决办法
     19.1版本的QuartusPrime Lite版本,安装了免费版的modelsim,已经设置了modelsim的路径: 但是还是提示: 打开Setting这里设置选中Modelsim-Altera 就可以了: ......
  • Consistency Models终结扩散模型
    最近看到一篇论文,觉得特别有意思,并且在学术界引起了不小的动静,他就是一致性模型,据说图像生成效果快、质量高,并且还可以实现零样本图像编辑,即不进行一些视觉任务训练,可以实现图像超分、修复、上色等功能。目前代码已经开源到GitHub上面:https://github.com/openai/consist......
  • Deep-Learning-Based Spatio-Temporal-Spectral Integrated Fusion of Heterogeneous
    Deep-Learning-BasedSpatio-Temporal-SpectralIntegratedFusionofHeterogeneousRemoteSensingImagesabstract为了解决STF中的生成heterogeneousimages问题:为此,本文首次提出了一种基于新型深度残差循环生成对抗网络(GAN)的异构集成框架。所提出的网络由前向融合部......
  • Adversarial Robust Deep Reinforcement Learning Requires Redefining Robustness
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! ......
  • drf之ModelSerializer
    目录简介语法示例使用Meta进行定义在Meta类外进行定义简介与表做强关联,之后不需要再写create与update函数了官网:https://www.django-rest-framework.org/api-guide/serializers/语法有多种写法,局部钩子与全局钩子是一样的class类名(serializers.ModelSerializer)#......
  • Deepin 系统图标更换方法
    测试成功的系统:Deepin20.9下载自己喜欢的图标主题文件(本文以WhiteSur主题为例):主题网站:https://www.gnome-look.org/browse?cat=132&ord=rating选择自己喜欢的图标主题,点进去。选择适合自己喜好的图标主题文件,点击下载即可。解压下载的图标主题文件压缩包:在下载文......
  • 论文解读(PGD)《Towards deep learning models resistant to adversarial attacks》
     论文信息论文标题:Towardsdeeplearningmodelsresistanttoadversarialattacks论文作者:AleksanderMadry,AleksandarMakelov,LudwigSchmidt,DimitrisTsipras,AdrianVladu论文来源:ICLR2018论文地址:download 论文代码:download视屏讲解:click1 介绍对抗攻击2......
  • Yolov5_DeepSort_Pytorch:基于 Yolov5 + Deep Sort 的实时多目标跟踪器
    Yolov5_DeepSort_Pytorch:基于Yolov5+DeepSort的实时多目标跟踪器 视界君 Python视界 昨天Python视界分享简介该存储库包含一个两阶段跟踪器。YOLOv5(一系列在COCO数据集上预训练的对象检测架构和模型)生成的检测被传递到跟踪对象的DeepSort算法。它可以跟踪Yolov5模型......