微软 Build 2026 暴击：7 款自研 AI 模型齐发，Project Polaris 替换 GPT-4，微软的「AI 独立宣言」

智智

Cover image for microsoft-build-2026-mai-polaris

6 月

微软 Build 2026 暴击：7 款自研 AI 模型齐发，Project Polaris 替换 GPT-4，微软的「AI 独立宣言」

AI 摘要：微软 Build 2026 一口气发布 7 款自研 MAI 模型：首款推理模型 MAI-Thinking-1 盲测胜 Sonnet 4.6，Project Polaris 自研编码模型 8 月起替代 GitHub Copilot 的 GPT-4 Turbo。Mustafa Suleyman 提出 thinki

AI 摘要 – 微软 Build 2026 发布 7 款自研 MAI 模型：推理、编码、图像、语音、转录全模态覆盖 – Project Polaris：微软自研编码模型，8 月起替代 GPT-4 Turbo 成为 GitHub Copilot 默认引擎 – MAI-Thinking-1 在盲测中胜 Claude Sonnet 4.6，SWE-bench Pro 对标 Opus 4.6

微软为什么要自己造模型？

6 月 2 日，旧金山。微软 Build 2026 的主题演讲台上，Microsoft AI CEO Mustafa Suleyman 一次性发布了七款自研 AI 模型。

如果你只是扫了一眼标题，可能会觉得「又是一场模型发布会」。但真正值得关注的不是模型的参数或跑分——而是微软在做什么。

微软是全球对 OpenAI 投资最多的公司。Azure 是 OpenAI 的独家云服务商。GitHub Copilot 用的是 GPT-4 Turbo。在 AI 圈，所有人都默认微软 = OpenAI 的云外壳。

Build 2026 打破了这种默认。

这不是一场普通的模型发布。这是微软的「AI 独立宣言」——从此以后，微软的核心产品线不再依赖单一的模型供应商。

MAI-Thinking-1：微软的第一张推理牌

先看最受关注的 MAI-Thinking-1。

这是一款 35 B 激活参数（约 1 T 总参数）的稀疏 MoE 模型，128 K 上下文窗口。微软强调了几个关键差异点：

完全从零训练，不使用第三方模型蒸馏。 在当前 AI 版权纠纷不断的背景下，这意味着 MAI-Thinking-1 的训练数据是「企业级、干净、商业授权」的——没有来自 OpenAI、Anthropic 或其他竞品模型的合成数据。

独立盲测胜 Sonnet 4.6。 微软使用了第三方评测平台 Surge 的 1276 个任务进行人工盲测，评估维度是「回答是否有帮助、是否推进了任务」。结果显示人类评审员偏好 MAI-Thinking-1 多于 Claude Sonnet 4.6。

编码能力对标 Opus 4.6。 在 SWE-bench Pro 上，MAI-Thinking-1 与 Claude Opus 4.6 不相上下。一个 35 B 激活参数的模型追上了 Anthropic 最强的旗舰——这个效率比值得关注。

在数学推理方面：AIME 2025 达到 97.0%，AIME 2026 达到 94.5%。这些数字表明微软在训练循环中确实建立了真正的推理能力。

但需要注意：目前 MAI-Thinking-1 仅对 Microsoft Foundry 用户开放私有预览，尚未在公开基准测试中接受独立验证。

Project Polaris：微软要用自己的模型替换 GPT-4

如果说 MAI-Thinking-1 是「秀肌肉」，Project Polaris 才是真正的战术核弹。

微软宣布，从 2026 年 8 月起，Project Polaris——微软自研的编码模型——将成为 GitHub Copilot 的默认推理引擎，替代 GPT-4 Turbo。用户可以享受 3 个月的回退期（到 11 月），之后 Polaris 将成为唯一的默认引擎。

Project Polaris 采用 Mixture-of-Experts 架构，针对不同编程语言有专门的子模块。Chain-of-thought 加 Tree-of-thought 推理在 Azure 定制 Maia 加速器上运行。训练数据使用「允许商业使用的代码」，微软还提供了 Code Content Guarantee——对 Polaris 生成内容的 IP 索赔进行赔偿。

这些细节不会让普通用户兴奋，但对企业法务部门来说价值连城——版权合规是阻止大模型进入企业生产环境的最大阻力之一。

更耐人寻味的战略信号：微软——OpenAI 最大的投资者和最亲密的合作伙伴——选择在自己的旗舰产品中用自研模型替换合作伙伴的模型。这会让每一个企业客户问同一个问题：「如果微软都在自己做，我们何必只绑定一家？」

「Thinking + Coding」：Suleyman 的 Agent 公式

Suleyman 在演讲中提出了一个简洁的框架：「思考（Thinking）+ 编程（Coding）」= 真正的 Agent 系统。

MAI-Thinking-1 负责拆解复杂问题、规划步骤、推理验证。MAI-Code-1-Flash（5 B 参数超高效模型）负责执行代码生成，成本对标 Haiku 级别。

这个分工模式不是微软独有的——Anthropic 有 Opus + Haiku，OpenAI 有 GPT-5.5 Pro + GPT-5.5 Nano。但微软的独特之处在于：它在自己的云平台（Foundry，前 Azure AI Studio）上同时提供 OpenAI、Anthropic 和开源模型的接入，现在又多了一层自研模型。

Copilot 被重新定位为「多模型平台」——不再只有一个模型引擎，而是根据任务智能路由到最合适的模型。Foundry 的模型目录已超过 3000 个。

其他五款模型：覆盖全模态

微软同时发布了：

MAI-Image-2.5：图像生成 + 编辑，Arena.ai 图像模型家族排名第 3
MAI-Image-2.5 Flash：更快更便宜的版本
MAI-Voice-2：多语言 TTS，支持声音克隆，覆盖 15+ 语言
MAI-Voice-2 Flash：高效版本
MAI-Transcribe-1.5：43 语言语音转文字，FLEURS 基准排名第一

这些模型已经在 Copilot、Bing、PowerPoint、Azure Speech 中运行——微软在用自家产品做模型验证，然后把验证过的模型开放给开发者。

对开发者和企业意味着什么

GitHub Copilot 用户将从 8 月起默认使用 Polaris。如果你依赖 Copilot 的特定行为模式，需要留意模型切换。
Foundry 成为一个多模型市场——3000+ 模型包括 OpenAI、Anthropic、微软自研和开源选项。供应商锁定正在被平台化替代。
MAI 系列的全栈覆盖意味着企业可以在单一平台上完成推理、编码、图像、语音的全流程——但也要接受微软生态的深度绑定。
版权保障是一个被低估的竞争维度——微软的「干净数据 + 商业授权 + IP 赔偿」可能成为企业采购决策中的决定性因素。

FAQ

Q：MAI-Thinking-1 能替代 GPT-5.5 或 Opus 4.8 吗？ A：目前不能。MAI-Thinking-1 在 SWE-bench Pro 上对标 Opus 4.6（非 4.8），综合推理能力尚未与最新旗舰正面比较。但它代表了微软自研的第一代推理模型，方向明确。

Q：Project Polaris 会对我使用的 Copilot 产生什么影响？ A：从 2026 年 8 月起，Polaris 成为默认引擎。如果你习惯的编码风格有变化，可以用 3 个月回退期切换回 GPT-4 Turbo。到 11 月后只有 Polaris。

Q：微软这是要和 OpenAI 分手吗？ A：不是分手，是「多供应商策略」。微软仍然投资 OpenAI，但不再独家依赖。今年 4 月修改的合作协议已经允许 OpenAI 在非 Azure 云上提供服务——微软现在只是对等回应。

微软 Build 2026 传递的信号很清楚：在 AI 时代，最安全的战略不是依赖最强的合作伙伴，而是自己会造轮子——同时保持平台对所有轮子的兼容。这七款模型的发布，加上 Project Polaris 的战术意义，标志着微软从「OpenAI 的云分销商」向「全栈 AI 平台」的转变正式完成。

作者

智智

Posts

Cover image for openai-codex-enterprise-chatgpt

3 6 月

OpenAI Codex 企业化：ChatGPT 合体、62 个企业应用接入、10 亿用户即将解锁「超级 Agent」

> AI 摘要 > - Codex + ChatGPT 将在未来几周合体，近 10 亿用户解锁 Agent 能力 > - Sites：通过 URL 即可创建和分享交互式 Web 应用 > - 6 款 Agent 插件覆盖数据分析、创意、销售、产品设计、投资、投行六大角色如果说 GitHu...

盒盒

AI产品

没有评论 Read More

Cover image for cerebras-kimi-k2-6-inference-speed

3 6 月

Cerebras 跑 Kimi K2.6 达到 981 tokens/s：万亿参数模型的「推理经济学」被改写了

> AI 摘要 > - Cerebras CS-3 在 Kimi K2.6 上跑出 981 tokens/s，是 GPU 云服务的 6.7 倍 > - 10K 输入 + 500 输出任务：Cerebras 5.6 秒完成，官方 Kimi 端点需 163.7 秒 > - Kimi K2.6：1T...

智智

AI产品

没有评论 Read More

2 6 月

Google Deep Research 接入 MCP 协议：从「查资料工具」到「通用数据分析师」

从「查资料机器」到「通用数据分析师」 AI 写研究报告这件事，过去两年经历了三个阶段。第一阶段是「联网搜索 + 总结」。你问一个问题，AI 搜索网页，返回一堆链接加一段摘要。能用，但像极了实习生交的周报 - - 有字数，没深度。第二阶段是「多步自主研究」。2025年12月，Goog...

智智

AI产品

没有评论 Read More

2 6 月

GPT Image 2 技术内核拆解：三层架构如何实现文字渲染和布局突破

这不是 DALL-E 4 - - 这是一场彻头彻尾的架构革命 2026 年 4 月 21 日，OpenAI 发布了 GPT Image 2。同一天，宣布 DALL-E 2 和 DALL-E 3 将于 5 月 12 日退役。这不是升级，这是换血。如果你用过第一代 GPT Image（20...

盒盒

AI产品, AI开发

没有评论 Read More

29 5 月

MCP 的三个「第一次」：OpenAI 企业级安全连接、Runway 视频生成接入、Perplexity 分词器开源

Model Context Protocol（MCP）是 Anthropic 在 2024 年底推出的开放协议，用于让 AI 模型连接外部工具和数据源。推出时大多数人的反应是「又一个协议」。一年半后的今天，MCP 的生态已经发生了根本变化。而 2026 年 5 月 27 日，可能是 MCP 历史上最重要的一天——三个「第一次」在同一天完成。 1. 第一次企业级安全连接 OpenAI 发布了一个看似简单的功能——「私人 MCP 服务器的安全连接」——但细节决定了它的意义：「你的团队保持 MCP 服务器在你的网络内，ChatGPT、Codex 和 Responses API 通过仅出站 HTTPS 连接。」这句话的关键词是「仅出站」（outbound-only）。传统上，企业将内部服务暴露给外部 AI 厂商需要做隧道、VPN、甚至是防火墙规则修改。安全团队最怕的就是在防火墙上开新的入站端口。OpenAI 的方案绕过了整个问题：Agent 主动用 HTTPS 连接 MCP 服务器，不需要企业接受任何入站流量。这背后是一个行业趋势：MCP 正在从 Claude...

盒盒

AI产品

没有评论 Read More

28 5 月

FastVideo Dreamverse 开源：一张 B200，7 秒生成 30 秒高清视频

实时视频生成又多了一个开源选项。Sky Computing Lab 在 5 月 27 日开源了 FastVideo Dreamverse——基于单张 NVIDIA B200 GPU 和 LTX-2 模型，实现实时视频生成的氛围引导工具。核心数字：7 秒生成 30 秒 1080p 视频。来源：X: @haoailab / GitHub / Blog 为什么重要实时视频生成有三个关键门槛：速度（不能等几分钟）、质量（1080p 是底线）、硬件成本（能不能跑在单卡上）。FastVideo Dreamverse 三个都过了。对比一下同一天 Runway 发布的 MCP 服务器——Runway 走的是云端 API 路线，FastVideo 走的是本地开源路线。前者方便但花钱，后者需要硬件但免费。技术栈 GPU：NVIDIA...

盒盒

AI产品

没有评论 Read More

26 5 月

Cursor Composer 2.5 实测：一个 Kimi K2.5 微调模型，凭什么在代码基准上对标 Opus 4.7——价格只要 1/60

5 月 18 日，Cursor 发了 Composer 2.5。没有发布会，没有博客预告。一个周日下午，版本号悄悄跳了。社区开始跑分，然后数据出来了：SWE-bench Multilingual 79.8%，比 Composer 2 高了 6 个百分点。CursorBench 默认模式下 63.2%，超过 Opus 4.7 的 61.6%。但真正让开发者社区讨论的不是分数——是价格。 Standard 模式下，每任务成本 $0.07。Opus 4.7 max 是 $4.10。差了将近 60 倍。 Key Takeaways – Composer 2.5 SWE-bench 79.8% 对标 Opus 4.7 的 80.5%，CursorBench 默认模式 63.2%...

盒盒

AI产品

没有评论 Read More

25 5 月

Claude Managed Agents 三大新能力详解：Dreaming、Outcomes 和多代理编排，Agent 不再只是「接个 API」

5 月 6 日，Anthropic 在旧金山举办了第二届 Code with Claude 开发者大会。和去年发布新模型不同，今年他们没有发任何新模型——而是发了一套 Agent 基础设施。 Claude Code 的创作者 Boris Churnney 在台上说了一句话：”Anthropic 内部已经没有手写代码了。“与其说这是炫耀，不如说是一个信号：当一家 AI 公司自己的开发流程已经完全由 Agent 驱动，他们要解决的下一个问题就不是「模型够不够强」，而是「Agent 能不能稳定跑在生产环境里」。这就是 Code with Claude 2026 的主题。Anthropic 为 Claude Managed Agents 发布了三个核心能力——Dreaming（跨会话记忆）、Outcomes（评分驱动的质量循环）、Multi-Agent Orchestration（多代理并行编排）——外加 Claude Finance 和 Add-ins...

盒盒

AI产品

没有评论 Read More

22 5 月

8.5k Star、699 Fork、Product Hunt #3：OpenHuman 这款 AI Agent 平台为什么突然爆了？

2026年5月第二周，GitHub Trending 榜上换了个新面孔。不是新的编程框架，不是新的 LLM 推理引擎，而是一个叫 OpenHuman 的桌面 AI Agent——17,709 Star，1,547 Fork，60个贡献者，v0.53.43 版本每几天迭代一次。它在 Product Hunt 上冲到 #3，Dev Community 上多篇文章同时讨论。Tech Times 写了一篇尖锐的分析：《The Agent That Reads You First》。但这个项目的有趣之处不在于增长数字——而是在于它选择了一条和所有主流 AI Agent 都不同的技术路线。它不是「等你描述任务然后执行」，而是「在你开口之前，它已经通过你的 Gmail、GitHub、Notion、Slack、Calendar 建立了一张上下文地图」。 Key Takeaways– OpenHuman 以「上下文优先」路线切入，区别于 OpenClaw 的广度模式和 Hermes 的观察学习模式– 118+ 第三方 OAuth...

盒盒

AI产品

没有评论 Read More

22 5 月

别再说AI视频不专业了，原生4K、角色一致性和每周15亿张图改变了局面

先说一个数字：ChatGPT每周有超过15亿张图片被生成。不是1500万，是15亿。OpenAI官方5月19日披露了这个数据，距离他们发布Images 2.0才几个月时间。这件事放在一年前，谁也想不到。但现在回头看，AI图像和视频生成正在同时经历一场质变——画质更好了，角色不乱变了，工具也从”玩玩而已”变成了”真能干活的”。我们不谈虚的，就聊三件刚发生的事。 Kling AI拿出了原生4K，好莱坞先开始用了 5月20日，Kling AI正式推出了全球首个原生4K视频生成模型。关键词是”原生”——不是拍个低分辨率视频再拉大，而是从底层就开始渲4K画质。目前已获得好莱坞制片人、动画工作室Wonder Studios和动画导演的三方采用反馈，共同指向：AI视频生成开始满足专业制作的质量底线了。角色一致性：PixVerse发现了一个简单但被忽略的解法 5月20日，PixVerse团队展示了一个工作流：在角色开始运动之前，先用AI生成一张清晰的角色分镜图作为参考，然后再基于这个分镜生成视频。这个看似简单的”多一步”操作，恰恰解决了AI视频最让人头疼的问题：同一个角色在不同镜头里长得不一样。用他们的话说：”相同的角色、清晰的故事节点、镜头指导、动作细节——一致性始于动作之前。” 每周15亿张图：ChatGPT正在成为最大的图像生成平台 ChatGPT周生成15亿张图意味着什么？做个不严谨的参照：Statista数据显示2023年全球数码相机出货量约780万台。按此估算，ChatGPT一周生成的图像数量大约相当于全球数码相机全年销量的2倍。这个趋势对AI视频生成有直接影响——图像生成的”人人都能玩”正在培养一批对AI视觉内容不抗拒的用户。 FAQ AI视频生成现在是免费的吗？ Kling AI和PixVerse都提供免费试用额度，但4K原生生成通常需要付费订阅。新用户注册一般有免费生成次数。原生4K和普通视频有什么区别？原生4K是模型从底层直接渲染3840×2160分辨率，每个像素都是AI计算出来的。普通方式是先生成720p/1080p再放大，放大过程会导致画面模糊或角色变形。我一个普通人能做出来专业级视频吗？可以，但不等于”随便点一下就行”。好的AI视频需要写清楚提示词，PixVerse展示的例子说明：细节越具体，效果越好。多试几次就能摸到门道。数据来源：OpenAI/X (@OpenAI)、PixVerse/X (@PixVerse_)、Kling AI/X (@Kling_ai)，2026年5月🔗 相关阅读：

盒盒

AI产品

没有评论 Read More

微软 Build 2026 暴击：7 款自研 AI 模型齐发，Project Polaris 替换 GPT-4，微软的「AI 独立宣言」

微软为什么要自己造模型？

MAI-Thinking-1：微软的第一张推理牌

Project Polaris：微软要用自己的模型替换 GPT-4

「Thinking + Coding」：Suleyman 的 Agent 公式

其他五款模型：覆盖全模态

对开发者和企业意味着什么

FAQ

作者

RELATED

Posts

OpenAI Codex 企业化：ChatGPT 合体、62 个企业应用接入、10 亿用户即将解锁「超级 Agent」

Cerebras 跑 Kimi K2.6 达到 981 tokens/s：万亿参数模型的「推理经济学」被改写了

Google Deep Research 接入 MCP 协议：从「查资料工具」到「通用数据分析师」

GPT Image 2 技术内核拆解：三层架构如何实现文字渲染和布局突破

MCP 的三个「第一次」：OpenAI 企业级安全连接、Runway 视频生成接入、Perplexity 分词器开源

FastVideo Dreamverse 开源：一张 B200，7 秒生成 30 秒高清视频

Claude Managed Agents 三大新能力详解：Dreaming、Outcomes 和多代理编排，Agent 不再只是「接个 API」

8.5k Star、699 Fork、Product Hunt #3：OpenHuman 这款 AI Agent 平台为什么突然爆了？

别再说AI视频不专业了，原生4K、角色一致性和每周15亿张图改变了局面

智盒－aiKit.vip

最新文章

SpaceX 以 600 亿美元股票收购 Cursor：马斯克的 AI 铁王座完整了

Agentjacking 警报：85% 成功率的 AI 编程 Agent 劫持攻击，2388 家组织已暴露

最新评论

栏目

分类目录

© copyright 2026. All Rights Reserved.

微软 Build 2026 暴击：7 款自研 AI 模型齐发，Project Polaris 替换 GPT-4，微软的「AI 独立宣言」

微软为什么要自己造模型？

MAI-Thinking-1：微软的第一张推理牌

Project Polaris：微软要用自己的模型替换 GPT-4

「Thinking + Coding」：Suleyman 的 Agent 公式

其他五款模型：覆盖全模态

对开发者和企业意味着什么

FAQ

分享这篇文章

作者

RELATED

Posts

智盒－aiKit.vip

最新文章

最新评论

栏目

分类目录

© copyright 2026. All Rights Reserved.