
6 月
NVIDIA GTC 台北三连击:Cosmos 3、Vera CPU、Nemotron 3 Ultra 同台发布
AI 摘要:NVIDIA GTC 台北 2026 发布三大产品:Cosmos 3 全模态物理 AI 世界模型、Vera CPU(Agent 专用处理器比 x 86 快 1.8 倍)、Nemotron 3 Ultra(5500 亿参数 MoE 开源模型快 5 倍)。Anthropic、OpenAI 确认采用 Vera。
比「黄氏定律」更值得关注的三样东西
2026 年 6 月 1 日,NVIDIA GTC 台北。Jensen Huang 穿着一贯的黑色皮衣走上台北音乐中心的舞台。这一次,他没有讲太多「算力翻倍」的故事 – – 虽然算力确实在翻倍。他拿出了三样真正能改变 AI 格局的产品。
Cosmos 3,全球首个全模态物理 AI 世界模型。Vera,首款专为 AI Agent 打造的新架构 CPU。Nemotron 3 Ultra,5500 亿参数的 MoE 开源模型,快 5 倍,便宜 30%。
三件事看起来互不相关,但如果你把它们放在一起看,一个完整的拼图就出来了 – – NVIDIA 不只是卖铲子的,它在用硬件、模型、数据构建一整套「从训练到部署」的物理 AI 闭环。
Cosmos 3 为什么不是「又一个视频生成模型」?
先解释 Cosmos 3 是什么。
不是 Midjourney。不是 Sora。Cosmos 3 是一个 Omni-Model(全模态模型),它同时能理解并生成文本、图像、视频、环境声音和动作。它的核心应用场景是 – – 机器人和自动驾驶。
传统上,你要让一个机器人学会「拿起桌上的杯子」,需要这样一套流程:① 用多个模型分别处理视觉、触觉、规划任务;② 收集海量真实场景数据;③ 在仿真环境中反复训练。每个环节都是独立系统,数据格式不统一,实验结果难以复现。
Cosmos 3 把这三个流程收进了一个模型。
基于混合 Transformer 架构(Mixture-of-Transformers),它将视觉推理、世界生成和动作预测统一在一个系统内。在已经开源的世界模型中,Cosmos 3 在 Artificial Analysis、Physics-IQ、PAI-Bench 和 R-Bench 四项测试中均排名第一。
「得益于多模态推理、语言、视觉和世界模型的突破,物理 AI 的爆发式增长指日可待。」 – – 黄仁勋,GTC Taipei 2026 Keynote
三个规模可选:Cosmos 3 Nano(8 B,快速推理)、Cosmos 3 Super(32 B,高端仿真)、Cosmos 3 Edge(即将推出,实时边缘推理)。
NVIDIA 还同步推出 Isaac GR 00 T 人形机器人参考设计,2026 年底由宇树推出。Cosmos 联盟包括 Agile Robots、Black Forest Labs、Runway、Skild AI 等,这意味着「物理 AI」正在从 NVIDIA 的一家愿景变成行业共识。
Vera:Agent 终于有了自己的 CPU
如果说 Cosmos 3 面向的是物理世界,Vera 面向的则是数字世界中的 Agent 工作流。
Vera 是 NVIDIA 第一款专为 AI Agent 设计的新架构 CPU。性能数据:任务完成速度比传统 x 86 CPU 快 1.8 倍。
不是快 10%。是 1.8 倍。这不算吓人的数字,但更关键的是 – – 它已经在量产。
而且采用方名单相当震撼:Anthropic、OpenAI、SpaceX AI 都在评估引入 Vera。是的,Claude 的创造者 Anthropic “正在评估引入 Vera 来扩展其对 CPU 要求极高的智能体工作负载”。字节跳动、CoreWeave、Lambda、Nebius 等超大规模云服务商也在列。
VIA NVLink-C 2 C 互连技术,Vera 担任 Vera Rubin 平台的主机 CPU,CPU 与 GPU 之间高达 1.8 TB/s 的相干带宽。对于需要长上下文、多轮推理的 Agent 任务,这种带宽优势会非常明显。
黄仁勋说了一句很精辟的话:「Vera 能帮数据中心创造更高的 Token 营收。」翻译成工程师语言就是:同样的电费,能跑更多请求。
Nemotron 3 Ultra:开源模型的「快」哲学
Nemotron 3 Ultra 是 NVIDIA 最新的开源旗舰模型:5500 亿参数,混合专家(MoE),基于混合架构(SSM 状态空间模型 + MoE)。
关键数据:
- 推理速度是同级开源前沿模型的 5 倍
- 使用成本低 30%
- 6 月 4 日起通过 Hugging Face、ModelScope、OpenRouter 以 NIM 微服务形式提供
这个模型的定位很清楚 – – 为全天候运行的 AI Agent 提供基座。它已完成适配主流 Agent 平台:Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands、OpenCode。
已经采用的企业包括 CrowdStrike(网络安全)和 Palantir(数据分析)。CrowdStrike 用它分析威胁数据,Palantir 用它统筹企业运营。
NVIDIA 还同时推出了 Nemotron 联盟,联合多家企业贡献数据共同训练。黄仁勋在 keynote 中透露已经在推进 Nemotron 4。
三件事拼在一起:NVIDIA 的「物理 AI 基础设施」闭环
单独看,Cosmos 3 是一个世界模型,Vera 是一个 CPU,Nemotron 3 Ultra 是一个开源模型。但合在一起看:
- 训练:Cosmos 3 生成合成数据和仿真环境 → 解决物理 AI 数据稀少的根本问题
- 推理:Vera CPU + GPU 组合提供高带宽低延迟的推理基础设施 → 让 Agent 快速决策
- 部署:Nemotron 3 Ultra 作为基座模型运行复杂的 Agent 工作流 → 便宜、开源、可私有化
一个机器人公司用这套组合:Cosmos 3 生成千万条仿真驾驶场景,Vera 系统在车端实时推理,Nemotron 在云端处理复杂决策 – – 这就是 NVIDIA 画的「端到端物理 AI」图景。
FAQ
Q:Cosmos 3 和 Sora、Veo 这类视频生成模型有什么区别? A:Sora/Veo 面向创意视频生成,Cosmos 3 面向物理仿真和动作推理。前者追求画面美感,后者追求物理精度(如重力、碰撞、运动轨迹)。
Q:Vera CPU 什么时候能买到? A:Vera 已量产,自 2026 年秋季起由系统构建商和云合作伙伴陆续推出。包括戴尔、HPE、联想、Supermicro 等。
Q:Nemotron 3 Ultra 是开源的吗? A:完全开源。模型权重、训练数据、推理代码将在 Hugging Face 和 GitHub 上提供。
Q:NVIDIA 这是要从「卖铲子」变成「自己挖矿」吗? A:不完全准确。NVIDIA 的模型是开源的,核心商业模式仍是硬件销售。开源模型的价值在于「拉动硬件需求」 – – 更好的 AI 需要更多算力,更多算力需要更多 GPU。
物理 AI 的拼图正在加速闭合。Cosmos 3 把仿真、推理、行动统一到单模型,Vera 为 Agent 提供专用算力,Nemotron 让企业能在私有硬件上跑前沿 AI。这三件事加在一起,可能比「GPU 又升级了」更值得开发者在意。










