Illustration: cover-openai-robotics.png
1

6 月

OpenAI 成立机器人部门:一个靠软件起家的 AI 公司,为什么要冒险做硬件?

引言

2026 年 5 月 31 日,Sam Altman 在 X 上发了一条推文,字数不多,但分量足够让整个 AI 行业停下手头的事:

“OpenAI Robotics is hiring.”

不是实验室项目,不是研究 paper,而是一个正式的事业部。负责人是 Aditya Ramesh——你可能不熟悉这个名字,但你一定知道他做的东西:DALL·E。

消息出来后,我翻了翻评论区。最多人问的不是”机器人长什么样”,而是一个战略问题:一个估值 650 亿美元的软件公司,为什么要在这个时候跳进机器人这个出了名的「烧钱深渊」?

这个问题问对了。也值得认真回答。

Key Takeaways – OpenAI 放弃了 2021 年机器人解散时的「数据不够」判断,转而采用硬件+ML 协同设计的新路径,直接由 DALL·E 作者 Aditya Ramesh 领导 (Sam Altman X 官宣, 2026) – 短期目标是赋能技术工人构建基础设施,而非卖消费级机器人——这比「人形机器人走进家庭」的叙事务实得多 – 本次战略扩张的核心线索是「世界模拟 → 世界交互」——如果 AI 的终极目标是 AGI,那它必须有一个身体

OpenAI Robotics 部门成立的概念图,展示软件与硬件融合的视觉隐喻

为什么是现在?复盘 OpenAI 从「放弃机器人」到「重启机器人」的五年

OpenAI 不是第一次碰机器人。

2021 年,这家公司默默解散了自己的机器人研究团队。当时的公开理由是:训练数据不够。在 GPT-3 大获成功的背景下,这个决定看起来合情合理——既然纯软件路线跑得这么快,为什么要去踩硬件的坑?

但到了 2026 年,情况彻底不同了。

[UNIQUE INSIGHT] 回头看,OpenAI 2021 年「放弃机器人」和 2026 年「重启机器人」的逻辑其实是同一个:数据范式变了。2021 年,机器人训练需要真实世界的物理交互数据,成本高得离谱。但 2024-2025 年,世界模型(world model)和仿真技术突飞猛进——Sora 证明了视频生成模型可以隐式学习物理规律,NVIDIA 的 DynoSim 让推理堆栈仿真速度达到实时的 1,500 倍 (NVIDIA AI, 2026)。当仿真足够逼真时,机器人不再需要一百万次真实摔倒来学会走路。

Sam Altman 在招聘公告中明确写道:Aditya Ramesh 的「世界模拟研究计划已演变为机器人研究」(Sam Altman, 2026)。这句话是关键——不是从头造机器人,而是一个研究路线自然而然走到了需要硬件载体的阶段

AI软件与机器人硬件融合概念图 — 代码/神经网络与物理机械实体的连接

Aditya Ramesh 是谁,以及为什么是他来领导 OpenAI 的机器人?

Aditya Ramesh 不是一个机器人专家。

他在 OpenAI 的成名作是 DALL·E 系列——文本生成图像的开创者。如果单纯按「谁有机器人背景」来选将,波士顿动力或特斯拉 Optimus 随便挖一个项目负责人似乎更合理。

但 Altman 选 Ramesh,恰恰说明 OpenAI 的机器人战略不是「硬件优先」。

Ramesh 的核心能力是多模态生成与世界理解。DALL·E 需要理解「一把椅子在不同角度、光照、风格下长什么样」,这本质上就是在构建一个视觉世界模型。DALL·E 3 更进一步,展示了对文本描述中空间关系和物理约束的精准把握。这些能力迁移到机器人领域,就是「理解物理世界并生成与之交互的动作序列」。

[PERSONAL EXPERIENCE] 我注意到一个有趣的细节:在 OpenAI 的招聘说明中,排在前面的岗位是「全栈硬件、系统及 ML 工程师」,而且特别强调了硬件与 ML 研究的协同设计。这不是传统机器人公司「先把硬件造出来再训练 AI」的路径,而是从第一天起就让硬件选择服务于模型需求。

OpenAI机器人 timeline — 2021年解散 vs 2026年重启

这个机器人和你想的不一样:不卖「人形管家」,先做「基础设施劳动力」

当人们听到「OpenAI 做机器人」时,第一反应往往是:又一个要跟 Tesla Optimus 或 Figure AI 抢人形机器人市场的。

但仔细读 Altman 的声明,短期目标写得非常具体:「支持技术工人构建未来基础设施」。这不是「给你家做家务的机器人」,而是在建筑工地、能源设施、大型工程项目中替代高风险重体力劳动

这个定位有三个战略妙处:

第一,绕开了消费级机器人最大的坑——定价和期望管理。 消费机器人要足够便宜(≤ 一部 iPhone)、足够安全(不能砸到小孩)、足够有用(比请钟点工划算)。这三个条件在 2026 年没有一个成熟的。但 B 2 B 基础设施场景下,一个造价 20 万美元但能在高危工地三班倒的机器人,ROI 算得过来。

第二,完美利用了 OpenAI 已有的 API 生态。 一个在工地上操作的机器人需要的不是 ChatGPT,而是多模态理解(视觉+空间+指令)+ 实时推理 + 安全约束。这正好是 OpenAI 已有能力栈的延伸。

第三,长期愿景「为每个人提供个人机器人」保持了叙事张力,但不用现在就兑现。 这跟 Tesla 卖 FSD 的逻辑一样——用一个震撼人心但模糊的长期承诺牵引研发,同时靠可落地的短期目标养活团队 (Sam Altman, 2026)。

Aditya Ramesh 技术路线 — DALL·E → 世界模型 → 机器人

具身智能赛道突然变挤了:OpenAI 的进入会改变什么?

OpenAI 入局的时间点很微妙。

就在上周,上海刚刚发布了支持多模态智能体开发与具身智能整机产品的「十五五」规划 (IT 之家, 2026);MWC 上海宣布将举办全球首次「人形机器人点球大战」,宇树科技等 8 支中国队伍参赛 (IT 之家, 2026)。而特斯拉 FSD 刚刚完成了全程零干预、6000 公里横穿加拿大的自动驾驶壮举 (IT 之家, 2026)。

具身智能这条赛道,一周之内就发生了三件大事。

但 OpenAI 的进入方式跟所有人都不一样。Figure AI 和特斯拉是从硬件起家往上做 AI;波士顿动力是从控制算法起家;中国的人形机器人公司则普遍走「硬件先行+场景验证」的路线。OpenAI 是唯一一个从世界模型往下做硬件的——它的起点是对物理世界的理解和模拟,硬件只是把这种理解「实体化」的载体。

[UNIQUE INSIGHT] 这意味着 OpenAI 可能不会自己造机器人本体。更可能的路径是:自己设计核心的传感+计算+执行参考架构,然后像 Android 之于手机行业一样,授权给各家机器人硬件厂商。考虑到 OpenAI 与微软、软银的密切关系,以及软银刚刚宣布在法国投资 750 亿欧元建设 AI 数据中心 (Bloomberg, 2026),这个生态联盟的想象空间相当可观。

具身智能赛道竞争格局 — OpenAI vs Figure AI vs Tesla vs 波士顿动力

FAQ

OpenAI 的机器人什么时候能买到?

短期内不会面向消费者销售。OpenAI Robotics 的短期目标是 B 2 B 基础设施场景,针对的是建筑、能源等领域的技术工人,而非家庭用户。Sam Altman 本人也未给出具体时间表。

这和 Tesla Optimus 有什么区别?

Tesla Optimus 是从汽车制造场景切入,走「自有工厂验证 → 对外销售」的路线,硬件自研。OpenAI 更可能走「参考设计 + 授权生态」的路线,核心壁垒在世界模型和多模态理解,而非机械本体制造。两者的商业模型完全不同。

OpenAI 2021 年不是解散过机器人团队吗,这次有什么不同?

2021 年解散的核心原因是训练数据不足、仿真技术不成熟。到了 2026 年,Sora 类视频生成模型和 NVIDIA DynoSim 等仿真工具已经大幅降低了机器人训练的「真实世界数据依赖」。这次重启的本质是技术条件成熟,而非战略反复。

中国的人形机器人公司会受到冲击吗?

短期影响不大,因为 OpenAI 目前不做硬件本体。但中长期来看,如果 OpenAI 真的走「操作系统式」的平台授权路线,可能会重塑整个具身智能的竞争格局——就像 Android 改变了手机行业的竞争维度一样。

结论

OpenAI 进军机器人,表面上是 Sam Altman 发了一条招聘推文,但在更深层,这是 AI 行业从「软件吃掉世界」走向「软件理解世界、然后作用于世界」的转折信号。

几点判断:

  • 这次是真的。 不是 PR 噱头,不是实验室 demo。从选派 Aditya Ramesh(而非外部挖角机器人高管)来看,OpenAI 的机器人战略根植于其已有的核心能力——世界模型和多模态理解,而不是为了追风口。
  • 路径很聪明。 B 2 B 基础设施先落地 → 积累真实世界数据和部署经验 → 逐步走向消费级。避开消费硬件最大的定价/安全/期望管理三重地狱。
  • 但风险也不小。 硬件和软件是完全不同的游戏规则。供应链管理、安全认证、物理部署——这些都是纯软件公司从没碰过的。OpenAI 的招聘要求中提到了「硬件与 ML 协同设计」,说明他们自己也知道这是一个挑战。
  • 对行业而言,好消息多于坏消息。 OpenAI 的进入会加速具身智能的资本流入和人才聚集,但对现有玩家来说,一个「做平台不做硬件」的 OpenAI 可能反而是理想伙伴——而不是直接竞争对手。

接下来值得关注的是:Aditya Ramesh 的团队会先发布什么?是开源的世界模型工具链,还是某个特定场景的参考硬件设计?不管是哪一个,它都可能像 DALL·E 当年一样,重新定义我们对「AI 能做什么」的想象。

[INTERNAL-LINK: 关于 AI 成本拐点的深度分析 → 美国企业 AI 配给制趋势解读] [INTERNAL-LINK: AI Agent 企业落地为什么这么难?→ 星巴克 AI 败局深度复盘]


来源

  • Sam Altman, “OpenAI Robotics is hiring”, X, retrieved 2026-06-01, https://x.com/sama/status/2061117302528188712
  • NVIDIA AI, “DynoSim: There’s a better way to serve your inference stack”, X, retrieved 2026-06-01, https://x.com/NVIDIAAI/status/2060781385686659416
  • IT 之家,“上海:支持多模态智能体开发与应用”, retrieved 2026-06-01, https://www.ithome.com/0/957/985.htm
  • IT 之家,“全球首次:MWC 26 上海将举办人形机器人点球大战”, retrieved 2026-06-01, https://www.ithome.com/0/957/938.htm
  • IT 之家,“6000 多公里全程零干预:特斯拉 FSD 完成全球首次横穿加拿大自动驾驶”, retrieved 2026-06-01, https://www.ithome.com/0/957/718.htm
  • Bloomberg, “SoftBank to Invest Some €75 Billion in AI in France”, retrieved 2026-06-01, https://www.bloomberg.com/news/articles/2026-05-30/softbank-to-invest-some-75-billion-in-ai-in-france-reports-say

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

RELATED

Posts