
6 月
微软自立门户:7 个自研 MAI 模型亮相 Build 2026,不再只做 OpenAI 经销商
一句话结论:微软在 Build 2026 一次性发布 7 个自研 MAI 模型,宣布从「OpenAI 经销商」走向「自有模型 + 开放分发」的双轨战略。
关键结论(Key Takeaways)
- 微软在 Build 2026 一次性发布了 7 个自研 MAI 模型家族,覆盖推理、编码、图像、语音、转录五个赛道
- 旗舰模型 MAI-Thinking-1 对标 Claude Opus 4.6,在 SWE-Bench Pro 编码基准上追平,人类盲测中胜过 Claude Sonnet 4.6
- MAI-Code-1-Flash 仅 5 B 参数,51% SWE-Bench Pro,已设为 VS Code 默认模型之一
- 所有模型从零训练无蒸馏,Suleyman 强调没有从别家模型里偷师
- 分发策略:Foundry 私有预览 + OpenRouter、Fireworks AI、Baseten 三方开放,首次支持直接微调权重
一次性掏出 7 个模型,Mustafa Suleyman 到底说了什么?
2026 年 6 月 2 日,微软 Build 大会主演讲台上,Microsoft AI CEO Mustafa Suleyman 做出了一场比所有人预期更激进的发布。一次性掏出 7 个自研模型。
在人工智能行业,这几乎是一个反传统操作。通常,一个 AI 实验室会选择在一年内精细打磨 1-2 款核心模型。但 Suleyman 的意图是直接用数量向业界宣告:微软不再只是分发商,现在是制造商。
Suleyman 在发布博文中写道:这一切都是为了微软及伙伴的长期自主,打造你可以信任的模型。长期自主,这是关键词。
微软曾在长达 6 年的时间里以 OpenAI 独家云服务商的姿态,将计算基础设施租赁给 Sam Altman 的团队,再从 Azure 上销售 OpenAI 的 API。这件事在 2026 年 4 月发生了根本性转变:双边伙伴关系修订,排他性条款取消,AGI 触发条款被删除。OpenAI 被允许直接从非 Azure 的云平台提供服务。微软失去了唯一入口的护城河。Build 2026 的 MAI 发布,就是对这个变化最直接的回应。
7 个模型五个赛道,微软的排兵布阵是什么逻辑?
MAI 系列模型不是杂乱一把撒,而是清晰地覆盖了 AI 应用的五个核心赛道:
- MAI-Thinking-1:文本推理模型,35 B 活跃参数,256 K 上下文
- MAI-Code-1-Flash:编码模型,约 5 B 参数,极致推理效率
- MAI-Image-2.5:旗舰图像生成模型
- MAI-Image-2.5-Flash:快速图像变体
- MAI-Transcribe-1.5:转录模型,43 个语种 SOTA 级别
- MAI-Voice-2:语音生成模型,15+ 语言
- MAI-Voice-2-Flash:低延迟语音模型
这个矩阵意味着微软把 AI 堆栈的几乎每个环节都铺上了自有模型。从最强推理到极致延迟,从高端图像生成到超多语种转录,微软的目标是告诉企业客户:你不需要切换供应商,Azure 上什么都有。
MAI-Thinking-1 凭什么对标 Claude Opus 4.6?
MAI-Thinking-1 是 MAI 家族的绝对旗舰。它有 35 B 活跃参数(Mixture-of-Experts 架构),256 K 的上下文窗口,支持最大 128 K Token 输出。微软的定位是能在推理和编码任务上与 Claude 和 GPT 竞争的专业化模型。
在 SWE-Bench Pro 编码基准上,MAI-Thinking-1 的表现追平了 Claude Opus 4.6。而在微软内部委托的 Surge 平台盲测中,人类评估者偏好 MAI-Thinking-1 的回复频率甚至超过了 Claude Sonnet 4.6。
Suleyman 特别强调了一个非常尖锐的差别:MAI-Thinking-1 从零训练,没有从任何其他公司的模型中蒸馏。在这个行业,许多实验室通过蒸馏快速追赶前沿,但微软选择从头从数据构建起。企业客户用的时候不会面临训练数据里有没有 GPT 生成内容之类的版权诉讼风险。这直接引向了 MAI 战略的一个关键差异化卖点:你可以信任的模型 + 知识产权赔偿承诺。
MAI-Code-1-Flash:5 B 参数拿下 51% SWE-Bench Pro
MAI-Code-1-Flash 可能是 7 个模型里最被低估的一个。它仅有约 5 B 参数,但在 SWE-Bench Pro 上拿下了 51% 的分数。很多 70 B+ 的大模型在 SWE-Bench Pro 上也只有 30-40% 左右的成绩。这个信号说明微软在小模型推理能力上做了不小的工程投入。
微软已经宣布 MAI-Code-1-Flash 将直接设为 VS Code 内置 AI 的默认模型之一。这个分发动作的重要性可能超过模型本身:只要有 VS Code 的地方,MAI 就可以通过默认设置触达开发者。GitHub Copilot 的模型层一直依赖 OpenAI、Anthropic 等第三方。MAI-Code-1-Flash 暗示了一个路径:微软正在将 Copilot 从模型聚合器逐步转变为终端模型的拥有者。
开放分发:这是微软最不像微软的一个动作
MAI 模型的另一个爆炸性消息不在模型本身,而在分发方式。除了 Microsoft Foundry,MAI 系列模型还直接上线了 OpenRouter、Fireworks AI 和 Baseten 三个独立分发平台。个人开发者可以从 OpenRouter 上按 token 付费调用;小型 AI 公司可以在 Fireworks AI 和 Baseten 上部署并微调 MAI 的权重。这是微软首次允许第三方开发者直接微调权重。在 OpenAI、Anthropic、Google 从未提供类似权限的背景下,这一举措可以被视为微软从短期许可证收入向长期生态锁定转型的信号。
这与微软在 Agent 运行时层面的 OpenClaw 开源策略是一致的:基础层务求免费和开源,把商业价值留在生态层和控制层。微软 Scout Agent 就是基于开源项目 OpenClaw 构建的常驻工作 Agent。简单地说:微软正在用开源下层 + 商业化上层这个策略,重新编排它在 AI 时代的竞争定位。
智盒判断:微软的 MAI 战略,短期止痛,长期赌命
MAI 模型在 2026 年 6 月的真实竞争力如何?从已公布的基准看,MAI-Thinking-1 在编码上追平了 Claude Opus 4.6,但 Claude 在 5 月 28 日已经升级到 Opus 4.8。MAI 刚刚追平上一代竞品,前沿差距仍然存在。然而,真正杀招不是技术,是价格和许可证。
如果微软能把 MAI 模型的价格打到比 OpenAI、Anthropic API 更低的程度,同时提供干净训练数据 + 知识产权赔偿 + 可微调权重这三张牌,在企业市场,这就是一个极为有力的组合。而微软押注的是:在企业级 AI 采购中,你能信任这模型的训练数据吗?最终会变成比这个基准高两分更重要的问题。这个赌注能不能赢,需要 12-18 个月的验证。但从 Build 2026 的产品密度看,微软是真的把牌全亮出来了。
FAQ
微软是否会完全放弃 OpenAI 的模型?
不会。Azure AI Foundry 仍然提供 OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列。MAI 是第三个、自有的选择,不是替代。
MAI-Thinking-1 的定价如何?
截至 2026 年 6 月 8 日,微软官方尚未公布详细定价。但考虑到 MAI 模型同时在 OpenRouter 上架,预计价格将形成与 OpenAI 和 Anthropic 的直接竞争,可能在每百万输入 Token 3-6 美元区间。
我能现在就用 MAI-Code-1-Flash 吗?
如果你使用最新版的 VS Code 且已更新到包含 MAI 模型的 Copilot 扩展,可以。此外,在 OpenRouter 和 Fireworks AI 上也可按 API 调用。
MAI 的模型权重会像 Llama 一样开源吗?
微软迄今为止没有宣布将 MAI 模型进行开源发布。开放权重微调(在 Fireworks AI/Baseten 上)和真正开源许可证的发布是两回事。第一方模型的权重目前仍需通过商业平台获取。










