人工智能(AI)、算力、数据、工程化能力、制造能力、整合能力、资金等,那个因素是制约人形机器人量产的核心卡点?
2024年10月24日,特斯拉三季度财报会议上,马斯克表示:我们是唯一一家真正具备大规模生产人形机器人所有必要条件的公司,因为其他公司缺少人工智能大脑,缺少真正实现大规模量产的能力,而特斯拉拥有超级计算集群Cortex。
2024年6月13日,特斯拉2024年股东大会上,马斯克首次谈到人形机器人初创公司:原型很容易,批量生产很难,甚至不可能。
股东大会上,马斯克提到初创公司难点(总结):1)大量0-1设计,包括电机、变速箱、传感器、电力电子设备;2)需要顶尖的工程师以及技术积累;3)需要高效、节能的推理计算机;4)需要强大的AI能力;5)需要非常擅长大规模制造。
近日,知名人形机器人初创企业[Figure AI]创始人Brett Adcock接受媒体访谈时被问到算力、AI和制造问题时表示:B轮投资方微软已经给了我们尽可能多的H100算力,目前已扩大了三次,变成了更大的集群,目前受到计算的限制;依托投资方OpenAI技术赋能和合作,目前已开始建立可以在我们的机器人上工作的新模型;制造层面,我们正在建设自己的制造工厂,机器人上的几乎所有东西最终都可能由 Figure AI 公司制造,但是现阶段,我们会以非常理性的方式进行制造(外包)。
11月6日,马斯克针对人形机器人量产问题给出更具体答案,在“X”平台发文表示:“Optimus 已经在工厂里执行一些任务,其能力范围正在迅速扩大;迄今为止,最困难的部分是改进Optimus的设计,使其易于制造和构建复杂的供应链,以便能够大批量生产。”
马斯克此次回应,好像进一步重申了人形机器人Demo容易,量产难以及特斯拉机器人团队已在算法层面取得不错进展且持续迭代,目前难点是反而是结构设计(硬件层面)无法支撑大批量量产。
参考特斯拉在车辆( Model Y 、 Model 3等)层面规律,Optimus极有可能沿袭车辆生产、进化路线,先实现最优结构设计,保证前期能执行一些任务前提下,AI层面逐渐升级进化,最终实现通用。
11月6日,小鹏AI科技日上,小鹏汽车董事长、CEO何小鹏在演讲中表示,做AI机器人比AI汽车更难,集成度要求更高,没有500亿投入做不好AI机器人(让我想到小米董事长雷军之前提到,将拿出1000亿来造车),如此朴实无华。
AI、算力、数据、工程化能力、制造能力、整合能力、资金等,那个因素是人形机器人量产核心卡点?
国内拥有全球范围内最多人形机器人本体公司且都是初创公司,以上因素感觉皆是核心卡点,都短时间无法突破;目前国内大多数人形机器人本体初创公司多是学院派教授创业团队,本身工程化思维极弱,样机零部件目前都是外包商来做,自己进行组装,目前更侧重谈软件算法,基本不聊如何批量生产,而算法的底层芯片却是依赖进口;整体而言,做通用人形机器人似乎不适合初创公司,沿袭人形机器人公司[Agility Robotics]走专一场景,或许是唯一正解。
[Agility Robotics]是目前全球范围内真正实现商业化落地的是双足人形机器人企业,旗下双足机器人Digit已在【GXO】Spanx 工厂中实现商业化落地,工作是从AMR 上拾取手提袋,然后将手提袋放到传送带上,如此往复,而其能落地的原因主要归功于场景单一,对泛化能力要求低。
而国内,真正能满足马斯克所提到的生产人形机器人诸多要素的好像只有同为车企的[小鹏汽车],后者目前已发布新一代人形机器人—小鹏Iron,并沿袭特斯拉Optimus技术(与车辆技术同源)和商业化路线(优先落地自家车间)。
从小编视角来看[小鹏汽车]旗下人形机器人Iron算不上国内第一梯队,Iron发布会现场,有关小鹏Iron描述更多是文字层面,实体没有现场亮相;宣传片相当于大型广告片,没有展示具体动作细节,后续发布的车间工作视频,如同定帧摆拍,并没有展示一连串完整动作;大会现场,所提到的已经在工厂部分岗位上“工作”,感觉夸大成分大一些;整体而言,技术听起来是高大上,但是实体展示一般般;期待更多展示视频。
而且Iron发布后,[Figure AI]创始人Brett Adcock更是线上维权,表示:Iron复制 Figure 01脊柱和臀部设计;同时表示:为什么在Figure 02上放弃这种结构呢?
特斯拉入局人形机器人赛道和人工智能、大模型技术突破性进展催生了本身具身智能浪潮;具身智能领域研究方向可粗略分为:具身智能大模型(机器人“大脑”)和人形机器人(本体+小脑)。
目前行业内有一种观点是:硬件决定了人形机器人应用落地能力的上限,但是目前人形机器人产业拥有的硬件基础支撑起来的应用上限,具身智能算法还暂时没有达到。也就是说,人形机器人的硬件基础本身能够支撑它完成的一些任务,由于现有AI算法的能力不足,目前的人形机器人还无法真正实现这样的产品力。具身智能技术的发展不如人形机器人硬件成熟,也就成了现在人形机器人产业最大的卡点。
接下来小编将从算力、软件算法、数据、硬件(核心零部件)、工程化等多层面,盘点人形机器人商业化卡点。
软件层面:“大脑”、“小脑”
从底层算法模型来看,机器人的软件可以分为大脑与小脑。大脑负责感知外界并模拟人类思维决策过程,小脑则模仿生物进行复杂的运动控制。大脑部分主要职能是环境理解、智能交互与认知推理,基础是机器视觉、大语言模型的发展;小脑部分主要职能是运动控制、路径规划和步态平衡。
大模型的通识理解能力、多级推理能力赋予人形机器人具身智能的核心;嵌入在大模型中的庞大先验知识库&强大的通识理解能力让机器人更好理解泛化任务,且基于思维链的多级推理能力,让人形机器人实现了具身智能。
国内外在具身智能基础模型方面差距仍然较大,无论是大语言模型、多模态模型还是仿真器,这些关键技术主要掌握在OpenAI、英伟达、特斯拉等海外巨头手中;目前人形机器人本体初创企业多是依托科技大厂多模态大模型赋能;但值的注意的是,国内大厂并没有针对人形机器人推出专门大模型,可以理解为目前国内没有一个团队真正从机器人出发,去做适配具身智能的大模型。
而且,目前大部分人形机器人本体公司对大模型的理解和应用并不深入,基本只是简单接入国内外通用语言大模型。
具身智能大模型(大脑)主要有两个路径:端到端具身大模型和分层端到端大模型。
但可以肯定的是,分层是阶段性选择,端到端可能是终极方案;自动驾驶的发展也经历了从规则到小模型,再到大模型的统一实现的过程,表明渐进性方案更有确定性。
目前来讲,大脑算法中的环境理解,基于机器视觉,发展相对成熟;规划决策算法是当前具身智能主要发展痛点,将伴随大模型的迭代而发展。
也正是基于此原因,全球范围内,相较于人形机器人本体,资本渐向具身大模型初创公司倾斜,尤其是国外。
注:完整版表格,前往“机器人头条”知识星球查看
现阶段,国外人形机器人本体公司融资基本停滞,主攻商业化;资本以转向具身智能大模型公司(机器人通用大脑),已产生多家独角兽企业,比如:【Skild AI】于今年7月完成3亿美元A轮融资,投后约15亿美元;【Physical Intelligence】(PI)于今年11月完成4亿美元融资,投后估值约24亿美元。
相较于国外,国内人形机器人本体初创公司仍旧是资本市场香饽饽;但目前来看,国内资本也渐渐向具身智能大模型公司(机器人通用大脑)倾斜,多家以机器人通用大模型为卖点(千寻智能、星海图)以及纯粹具身智能大模型初创企业(穹彻智能、星云智慧、自变量机器人等)接连完成大额融资。
目前大小脑发展不均衡,相较于智能“大脑”的智力快速提升,灵巧“小脑”能够实现的灵巧操作能力亟待加强;小脑部分发展的制约因素包括精细运动执行尚未有统一的底层算法和数据采集。
双足控制算法:
运控模块(运控算法)是目前双足人形机器人公司核心技术壁垒。
机器人的腿主要看两点,一个是有是否已经完成了诸如复杂地形行走这样本应该由腿足实现的功能;二是能否支撑双臂完成全身协同的通用操作。
... ... ...
接下来小编继续从算力、软件算法、数据、硬件(核心零部件)、工程化等多层面,盘点人形机器人商业化卡点;并从现阶段人形机器人企业产品(进展)、硬件设施(生产能力)、产品落地场景、企业官方宣布量产时间,盘点全球(含国内)人形机器人企业现况以及国内人形机器人发展乱象。
... ... ...
本文内容仅展示一部分,更多详细解读,扫码加入知识星球“机器人头条”,查看完整版文章:[原创]人形机器人商业化卡点(人形机器人创企九死一生),并深度了解“具身智能&人形机器人”赛道
标签:赛道,AI,模型,机器人,具身,人形,智能,卡点 From: https://blog.csdn.net/Robot251/article/details/144088648