首页 > 其他分享 >【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试

【转载】逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试

时间:2024-03-31 14:55:43浏览次数:30  
标签:动力 P1 机器人 塘朗山 双足 逐际 强化

原文:

https://weibo.com/1255595687/O5k4Aj8l2


image



【逐际动力双足机器人P1在深圳塘朗山零样本、无保护、全开放完成测试】

上周,就在全球AI界被美国初创公司Figure联合OpenAI发布的首款人形机器人Figure 01相关视频而震撼的时候,中国深圳的“逐际动力双足机器人P1”早已低调地完成了塘朗山郊野大挑战。

3月12日,基于强化学习(Reinforcement Learning,RL),“逐际动力双足机器人P1”第一次来到位于深圳的郊野公园塘朗山,零样本、无保护、全开放进行测试,开箱即跑,在完全陌生的野外环境中,高动态完成了在多种复杂地形上的移动,表现出强化学习训练后,优异的控制力和稳定性。

P1是逐际动力在中国率先推出的一款新颖的双足机器人,也是逐际动力强化学习系统化研发与模块化测试的重要平台,用于推进双足基础运动能力的研发和迭代。P1成功征服野外森林,正是逐际动力强化学习系统化。

逐际动力在强化学习有着长期的积累,目前聚焦把强化学习的前沿技术转化为系统化研发能力,支持产品功能开发,并提出了自己的强化学习研发体系,主要包括Real2Sim2Real闭环、神经网络架构设计、数据生成机制与训练算法设计等三大核心版块,搭配不断完善的流程管理和算法验证,推动人形机器人重要功能的开发。

P1是逐际动力在中国率先推出的一款新颖的双足机器人,也是逐际动力强化学习系统化研发与模块化测试的重要平台,用于推进双足基础运动能力的研发和迭代。P1成功征服野外森林,正是逐际动力强化学习系统化研发的成果,也是三大核心板块能力的体现。

Real2Sim2Real闭环,从Real2Sim到Sim2Real,打通数据到数据的自动闭环,不管是采集物理世界数据生成仿真模型,还是把仿真后的策略部署到硬件上,从数据的生成、迁移到部署,逐际动力的目标是实现全过程自动化,最大限度降低人工干预,缩小仿真和现实之间的差距,提高训练的效率和质量。

神经网络架构设计,神经网络并不是一个黑盒,而是一个科学的系统化复杂结构,决定了强化学习能力的上限,其架构的设计体现了不同团队的特点和实力。逐际动力的神经网络由不同模块组成,如何划分模块、如何定义每个模块、每个模块输入输出的界面是什么,这些设计至关重要。逐际动力打造的神经网络架构能够有效应对环境交互和硬件差异带来的巨大干扰,生成具有自适应性的控制策略,实现同一个神经网络适用于不同的机器人和场景。

数据生成机制与训练算法设计,在强化学习中,数据是训练的关键,但不是数据规模越大,训练效果就一定越好。逐际动力把重点锁定在解决有效数据稀缺的问题上,提出迭代式预训练(Iterative Pre-training)方法,把通用机器人的基础运动能力划分为不同级别,进行循序渐进的预训练,这个过程让训练的结果更可控,从而高效地产出和收集有效数据,训练出高性能的策略(Policy)。

在这次测试中,我们看到野外和实验室、城市的最大区别是,没有一个台阶或者斜坡,甚至平地是一样的;从山脚到山顶,沿途的地貌截然不同,水土流失导致地下岩石裸露,斜坡上长满缠绕的藤蔓,土层风化变成泥沙覆盖地面,就地取材搭成的沟渠奇形怪状,这些都是P1从未经历过的场景,对于普通人来说也不是轻而易举就能克服。

在仿真训练过程中,P1没有被输入过任何与森林、徒步相关的数据,与落地环境差异巨大,但依然能够适应全新的环境,在变化莫测的森林中自如行走。这得益于逐际动力系统化的强化学习训练,保证研发成果在实际应用中可行、可用、可靠。



标签:动力,P1,机器人,塘朗山,双足,逐际,强化
From: https://www.cnblogs.com/devilmaycry812839668/p/18106737

相关文章

  • 【洛谷P1036】 [NOIP2002 普及组] 选数
    一、题目:二、解题思路:本文章采用的解决方法是递归与DFS(深度优先搜索)。以下图是思路图:1.首先-确定位置题目说4个数字取三个数,所以考虑的只有三个位置和这三个位置分别放什么数值。从第一个位置开始放数。2.其次-开始放数分为4种可能,第一位置可以先放3,那么第二个位置......
  • P1481 魔族密码
    原题链接题解1.由于我刚刚才学字典树,所以我会告诉你这就类似字典树,对字符串终点节点加一,然后搜索统计最大前缀和code#include<bits/stdc++.h>usingnamespacestd;strings;inttree[2000005][65]={0};intnum=0;intcnt[2000005]={0};intinshe(chara){if(a>='a......
  • 【洛谷】P1004 [NOIP2000提高组]方格取数
    题目描述题目描述设有N×N 的方格图(N≤9),我们将其中的某些方格中填入正整数,而其他的方格中则放入数字 0。如下图所示(见样例):某人从图的左上角的 A 点出发,可以向下行走,也可以向右走,直到到达右下角的 B 点。在走过的路上,他可以取走方格中的数(取走后的方格中将变为......
  • 英锐恩科技推荐消防类插孔电话指示芯片EN8P18E
    EN8P18E是一款高压定时显示LED芯片,是一种消防类插孔电话指示芯片。内置了一组整流桥、降压电路和定时电路,专门应用于高压通信信号指示的应用场景。芯片工作稳定,LED指示时间恒定,不随输入电压的变化而变化。高压电路是采用低功耗高压电源设计,保证了其低压差和低静态电流的特性,它......
  • luogu P1543 [POI2004] SZP 题解
    题目传送门前置知识树形DP解法将\(a_{i}\)向\(i\)连一条有向边,这样就形成了基环外向树森林。基环外向树森林内每棵基环外向树是相互独立的,需要单独处理。对于每棵基环外向树,任取环上一点\(x\),断开\(x\)到\(fa_{x}\)的有向边,外向树就变成了一棵以\(x\)为根的树。......
  • P1149 [NOIP2008 提高组] 火柴棒等式
    题目链接:本题比较重要的点在于判断加数的范围,即枚举的范围大小。由于题目已知\(n\leqslant24\),且用数字\(1\)拼成的数尽可能大。由于\(1111+1=1112\)已经用了\(25\)根小棒,已经超过了题目\(24\)根小棒的数据范围,所以上界为\(1111\)。#include<cstdio>inta[10]=......
  • 《自动机理论、语言和计算导论》阅读笔记:p68-p114
    《自动机理论、语言和计算导论》学习第4天,p68-p114总结,总计47页。一、技术总结1.invertedindexes明白单词的意思是“反转的索引”,但是不明白其在书中具体指什么,去查询资料的话需要花很不多时间,先继续往下看。遇到这种场景的可能性还是比较多的。2.lexicalanalysis(1)lexico......
  • 洛谷题单指南-图的基本应用-P1127 词链
    原题链接:https://www.luogu.com.cn/problem/P1127题意解读:按字典序排列单词,使得相邻单词的首位字母一样。解题思路:由于单词之间可以相邻的条件是前一个单词的末尾字母和后一个单词的开头字母一样,因此可以遍历每一个单词,再找到每一个可以接在其后面的单词,建立一个邻接表,然后从......
  • [题解]P1439 【模板】最长公共子序列
    P1439【模板】最长公共子序列题意简述给出\(1,2,…,n\)的两个排列\(P_1\)和\(P_2\),求它们的最长公共子序列。范围限制:\(n\le10^5\)。样例53214512345输出:3。思路简述这道题看似是最长公共子序列,但是发现如果用\(O(n^2)\)的复杂度实现\(LCS\)就会时......
  • OWASP10
    访问控制崩溃未对通过身份验证的用户实施恰当的访问控制。攻击者可以利用这些缺陷访问未经授权的功能和数据,例如:访问其他用户的账户、查看敏感文件、修改其他用户的数据、更改访问权限等。eg:零元购通过修改URL、内部应用程序状态或HTML页面绕过访问控制检查,或简单地使用自定义......