MiniMax M3 对决阶跃Step 3.7 Flash国产大模型封面图
4

6 月

MiniMax M 3 与阶跃 Step 3.7 Flash:国产大模型的双重突围

6 月的第一周,两家中国 AI 公司不约而同地发布了旗舰模型。但它们的策略恰好是两条相反的路。

MiniMax M 3 凭什么敢叫「中国第一个 Frontier 开源模型」?

MiniMax M 3 的定位是「中国第一个 Frontier + 开源模型」——齐备前沿编程、1 M 上下文、原生多模态三大核心能力。SWE-Bench Pro 59%,超越了 GPT-5.5 和 Gemini 3.1 Pro,接近 Claude Opus 4.7。

它使用自研 MSA(MiniMax Sparse Attention)注意力架构,在处理百万上下文时,每个 Token 的计算量压到上一代的 1/20。还配有与 M 3 联合训练的 MiniMax Code Agent 产品,能直接操作桌面应用。

金融信号:MiniMax 同时宣布筹备 A 股科创板上市。港股股价从 165 港元涨到 667.5 港元,涨幅 304%。

阶跃 Step 3.7 Flash 如何在 1/9 成本下实现 97% 性能?

阶跃星辰的 Step 3.7 Flash 走的完全是另一条路。196 B 总参数的 MoE 架构,每次推理只激活 11 B 参数。单请求生成速度最高 400 Tokens/秒。在 OpenClaw Advisor 模式下,每个 Agent 任务成本仅 $0.19——Claude Opus 4.6 是 $1.76。1/9 的价格,97% 的性能。

一部 128 GB Mac Studio 就能跑。全面开源,vLLM、SGLang、llama.cpp 全部支持。

MiniMax M3 与阶跃 Step 3.7 Flash 性能成本对比

这两条路线对中国 AI 出海意味着什么?

两条路线代表了中国 AI 模型出海的不同战略——M 3 代表「你有资源就跑我,开源等你来」,Step 3.7 Flash 代表「你现在就能用我,而且几乎不花钱」。两者都将自己定位为「Agent 基座模型」,看好 AI Agent 是下一个主战场。从「不敢开源怕被超」变成「用开源换生态和口碑」,这是战略自信的体现。

智盒判断

短期:Step 3.7 Flash 可能在一两个月内成为海外开发者「性价比 Agent 基座」的首选之一。400 TPS 对实时 Agent 体验至关重要。

中期:M 3 适合全模态能力场景(文档理解、桌面操作),Step 3.7 Flash 适合高吞吐量 Agent 场景。两者的差异化会越来越清晰。

长期:真正拉开差距的不是模型本身,而是生态。谁的 API 更稳定、文档更清晰、社区更活跃,谁就能在海外站稳。

相关阅读AI 资本三级火箭:Suno、DeepSeek、Anthropic · DeepSeek V 4 发布:大模型竞争进入生态战 · 硅谷的 AI 算账时刻

FAQ

我该用 MiniMax M 3 还是阶跃 Step 3.7 Flash?

需要全模态能力选 M 3,追求极致性价比和低延迟选 Step 3.7 Flash。两者都支持 API 调用,可以先实测对比。

它们和 Claude/GPT 的差距有多大?

在 Agent 任务上 Step 3.7 Flash 做到了 Claude Opus 4.6 的 97%。在编程基准上 M 3 超越了 GPT-5.5。但在复杂推理、安全对齐方面,Claude Opus 4.8 仍是标杆。

参考来源:MiniMax 官方,新智元,LLM Stats, 财复视界,掘金

RELATED

Posts