智能体 - 智盒

7 6 月

GPT-5.5 Instant + Dreaming V3 双发 — OpenAI 把「高端 AI + 持久记忆」变成了免费基础设施

6 月 6 日，OpenAI 同时交付了两个「面向所有人」的更新：GPT-5.5 Instant 取代 5.3 成为 ChatGPT 默认免费模型；Dreaming V3 记忆架构上线，算力降 5 倍后首次向数亿免费用户推送。关键数字：事实召回成功率 82.8%，偏好遵循通过率 71.3%。免费和 Go 用户记忆容量翻倍。新增「记忆摘要」页面让你能看见 ChatGPT 记住了你什么。为什么「算力降 5 倍」是商业上最重要的数字？在 AI 行业，任何需要持续运行的功能都在烧钱。Dreaming 在后台持续审查历史会话、整理记忆点、更新上下文——给 10 亿用户跑 Background Dreaming 的账单曾经让 CFO 夜不能寐。降 5 倍之后，「给数亿免费用户开记忆」从烧钱变回了可盈利。两件事放在一起看：OpenAI 正在把免费层变成付费层的「平替」吗？半年前，好模型要钱（GPT-5.4 Thinking），记忆要钱（Dreaming 只在付费）。现在，好模型免费（GPT-5.5 Instant 默认），记忆也免费（Dreaming...

盒盒

资源, 资讯

2 评论 Read More

4 6 月

微软 Build 2026 全复盘：自研 MAI 模型登场，与 OpenAI 从盟友变对手

6 月 2 日，旧金山 Moscone Center，微软 Build 2026 开发者大会开幕。这可能是微软近年来最有「独立宣言」意味的一场开发者大会。 CEO Satya Nadella 的 Keynote 逻辑非常清晰：从模型（MAI 系列）、算力（Surface RTX Spark Dev Box）、Agent 平台（Copilot Autopilots + Scout）、到硬件（Project Solera、Majorana 2 量子芯片）——微软要控制 AI 技术栈的每一层。一口气发布 7 款自研模型，微软的底气从哪来？最引人注目的是 MAI 模型家族，7 款一次性发布： MAI-Thinking-1：首款推理模型，35B 激活参数，128K 上下文，在 SWE-Bench Pro 上与 Claude Opus...

盒盒

资源, 资讯

1 条留言 Read More

4 6 月

ChatGPT + Codex 史诗级合体：10 亿用户一夜获得 Agent 能力，AI 应用的「分发层」战争打响了

结论速读：ChatGPT 与 Codex 合体的核心不是多一个编程功能，而是 OpenAI 把 Agent 能力放进最大用户入口。谁控制入口，谁就能决定 Agent 如何被发现、调用和分发。「未来几周内，Codex 将整合进 ChatGPT。」这 15 个字比任何新功能都重要——OpenAI 正在用分发能力碾压 Anthropic 的先发优势，Agent 时代的「浏览器 vs 客户端」之争正式开打。三枚核弹齐发，这次和以往有什么不同？ 6 月 2 日，OpenAI 在「Intelligence at Work」线上发布会上宣布三大更新：第一枚：Codex 整合进 ChatGPT 不只是桌面端——手机、浏览器、甚至 Excel、Slack、PowerPoint 都覆盖。ChatGPT 有 10 亿月活用户（Sensor Tower 数据），Codex 有 500 万周活。把 Codex「揉」进 ChatGPT，就是在告诉...

盒盒

资源, 资讯

没有评论 Read More

4 6 月

微信悄悄内测 AI 智能体：如果 Agent 能调用 300 万个小程序，会发生什么？

6 月 2 日，英国《金融时报》等多家媒体爆出一条可能改变中国互联网格局的消息：腾讯正在微信中测试内置 AI 智能体原型，这已被列为公司最高战略优先级。具体形态是：用户在微信主界面向右滑动，调出智能体对话窗口。输入指令后，智能体自动调用微信内数以百万计的小程序，完成信息查询、服务办理、内容创作等一站式任务。资本市场反应极为剧烈：腾讯控股当日股价大涨 10.46%，市值单日增加超 4100 亿港元，创 2021 年 1 月以来最大单日涨幅。市场在用真金白银表达一个判断：微信 + AI Agent 的组合，可能是中国 AI 应用层最大的爆发点。微信从「工具集合」到「Agent 操作系统」，变化到底有多大？ 1. 从「工具集合」到「Agent 操作系统」微信历史上最大的转型。你不再是手动在聊天、支付、小程序之间切换——Agent 替你在底层调度一切。 2. 小程序价值的重估 300+ 万个小程序覆盖吃饭、出行、购物、缴费、政务、医疗、娱乐。以前你需要记住每个小程序的入口，现在你跟 Agent 说「帮我订明天去上海的高铁票，靠近静安寺的酒店，顺便把今晚要看的电影票也订了」，Agent 自己去跑。 3. 互联网入口的彻底重构如果微信 Agent 好用，用户为什么还要分别打开滴滴、美团、12306、携程？这些 App 会从「目的地」变成微信 Agent 的「后端服务商」。 4. Agent 可与小程序双向互动消息源透露，Agent 不仅能调用，还能操作小程序。这意味着它可以完成跨应用的多步骤复杂任务——类似 Anthropic Computer...

盒盒

资源, 资讯

1 条留言 Read More

4 6 月

MiniMax M3 与阶跃 Step 3.7 Flash：国产大模型的双重突围

6 月的第一周，两家中国 AI 公司不约而同地发布了旗舰模型。但它们的策略恰好是两条相反的路。 MiniMax M3 凭什么敢叫「中国第一个 Frontier 开源模型」？ MiniMax M3 的定位是「中国第一个 Frontier + 开源模型」——齐备前沿编程、1M 上下文、原生多模态三大核心能力。SWE-Bench Pro 59%，超越了 GPT-5.5 和 Gemini 3.1 Pro，接近 Claude Opus 4.7。它使用自研 MSA（MiniMax Sparse Attention）注意力架构，在处理百万上下文时，每个 Token 的计算量压到上一代的 1/20。还配有与 M3 联合训练的 MiniMax Code Agent 产品，能直接操作桌面应用。金融信号：MiniMax 同时宣布筹备 A 股科创板上市。港股股价从 165...

盒盒

资源, 资讯

1 条留言 Read More

GPT-5.5 Instant + Dreaming V3 双发 — OpenAI 把「高端 AI + 持久记忆」变成了免费基础设施

微软 Build 2026 全复盘：自研 MAI 模型登场，与 OpenAI 从盟友变对手

ChatGPT + Codex 史诗级合体：10 亿用户一夜获得 Agent 能力，AI 应用的「分发层」战争打响了

微信悄悄内测 AI 智能体：如果 Agent 能调用 300 万个小程序，会发生什么？

MiniMax M3 与阶跃 Step 3.7 Flash：国产大模型的双重突围

智盒－aiKit.vip

最新文章

Marketing Skills — 37K 星 AI Agent 营销技能库：CRO、SEO、文案、增长工程一站式 Agent 工具包

AI Job Search — 7K 星 Claude Code 求职框架：让 AI Agent 帮你投简历、写求职信、模拟面试

最新评论

栏目

分类目录

© copyright 2026. All Rights Reserved.