2025 年,通用机器人要从实验室走向市场了吗?

内容摘要近期,英伟达 CEO 黄仁勋在 GTC 2025 大会上预测,「我们将进入代理式 AI(Agentic AI)的时代,接下来将是物理 AI(Physical AI),也就是机器人的时代。」目录01. 都在卷通用机器人的「大脑」?为什么 20

近期,英伟达 CEO 黄仁勋在 GTC 2025 大会上预测,「我们将进入代理式 AI(Agentic AI)的时代,接下来将是物理 AI(Physical AI),也就是机器人的时代。」

目录

01. 都在卷通用机器人的「大脑」?

为什么 2025 年,各家都在卷通用机器人的「大脑」?...

02. 通用机器人领域的关键玩家们近期都在做什么?

这些关键玩家谁能做成通用机器人的「基座」?

通用机器人控制模型技术路线还没有收敛?

真机数据还是合成数据,通用机器人核心问题数据如何解决?

通用机器人领域的关键玩家们近期都在做什么?...

01 都在卷通用机器人的「大脑」?

1、机器人初创公司 Figure AI 近期提出了一个通用具身智能模型 Helix,是首个能够输出高频率连续控制整个类人上肢的 VLA。Helix 模型实现的突破性效果,引发了近期对于具身机器人领域进展的关注。

2、Figure AI 的 CEO 布雷特·阿德科克在近期的一次访谈中预测,人形机器人领域最终胜出的公司数量会很少,可能只有一两家。因为需要大量的资金、优秀的团队以及大规模的机器人生产来降低成本并实现数据共享和学习。

3、国内外通用机器人领域的几十家关键玩家谁能成为最终胜出的这「一两家」我们不得而知,而近期该领域的产品、技术进展颇多,通过观察近段时间各家发力的方向也许能找到一些「蛛丝马迹」。

4、一个趋势是目前都在发力做通用机器人的「基座」,「基座」的具体形态可能是通用具身智能模型,也可能是通用具身智能平台,旨在让通用「基座」实现跨实体、适用于不同场景。

① 例如,Figure AI 推出了通用具身智能模型 Helix;英伟达推出了通用人形机器人基础模型 GR00T N1;智元机器人推出了通用具身基座大模型 GO-1;北京人形机器人创新中心推出了通用具身智能平台 「慧思开物」。

② 但做通用机器人控制模型,在技术路线上仍没有收敛,分层与端到端两个技术方向的优劣势各有不同。

③ 此外,还有一个方向是给通用机器人的「控制器」加入空间推理能力,从 2D 跨越到 3D 场景的转变。例如,谷歌推出的机器人具身智能大模型 Gemini Robotics-ER 重点在空间推理方面,能够更好地适应动态环境。

5、另一个「发力」方向为解决通用机器人的数据问题。数据方面,包括解决机器人异构数据的融合问题、提升数据-性能的转化率、真实数据还是合成数据的分歧、以及如何用好互联网中的视频数据等。

① 例如,Figure AI 构建了一个独特的数据引擎;英伟达推出用于合成操作运动生成的工具「Isaac GR00T 蓝图」;智元自研了用于提升数据利用率的 ViLLA 架构;傅利叶智能开源了真机训练数据集「Fourier ActionNet」。

02  通用机器人领域的关键玩家们近期都在做什么?

1、机器人初创公司 Figure AI 提出了通用具身智能模型 Helix。Helix 模型能以 200Hz 的高频率协调 35 自由度的动作空间,控制从单个手指运动到末端执行器轨迹、头部注视和躯干姿势等一切。且具备优秀的零样本泛化能力,能够识别并操作数千种从未见过的小型家居物品。[2-1]

2、Helix 是一个通用的视觉 - 语言 - 动作(VLA)模型,也是同类产品中首个采用「系统 1 + 系统 2」框架的 VLA 模型。这两个系统经过端到端的训练,可以进行通信,并高速、灵巧地控制整个人形机器人上半身。系统 1 (S1) 是一种快速反应的视觉运动策略,可将 S2 产生的潜在语义表征转换为 200 Hz 的精确连续机器人动作。系统 2 (S2) 为一个 VLM 骨干网络,基于 70 亿参数的开源、开放权重的 VLM 构建,用于场景理解和语言理解,实现跨物体和上下文的广泛泛化。

① Helix 的特点是使用一套统一的神经网络权重来学习所有行为,只需维持单个训练阶段和一组神经网络权重,无需单独的动作头或针对每个任务的微调阶段。

2、对于机器人数据方面,Figure AI 构建了一个独特的数据引擎,随着机器人的不断运行,AI 数据引擎将收集并整理数据用于训练模型,不断提升性能。Figure 于去年 8 月推出的人形机器人 Figure 02,数据引擎通过不断地从云端获取、更新和优化最新的 AI 模型,并且这些模型在机器人的 GPU 上运行,确保了 Figure 02 在执行任务时的智能性和适应性。

3、Figure AI 的 CEO 布雷特·阿德科克也曾在一次访谈中提到对于机器人数据的重要性。布雷特认为,大型语言模型(LLM)中并不存在真实的机器人操作数据 ......

 关注

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-4