28 5 月

Google I/O 2026 复盘:Gemini 月活 9 亿、全栈 Agent 化、世界模型,Google 用「生态反击」回应了所有人

如果你这周只看了一场发布会,你可能会以为 Anthropic 和 OpenAI 是这个行业唯一的两个玩家。 5 月 20 日 Google I/O 把这种印象彻底打碎了。Pichai 开场用了不到 20 分钟甩出一组数字:Gemini 月活 9 亿(一年前是 4 亿),覆盖 230 个国家 70 种语言,Google Search 的 AI Mode 查询量每季度翻倍。然后才是产品:Gemini 3.5 Flash、Omni 世界模型、Spark 跨应用 Agent、Agent Payments Protocol。 但 Google I/O 2026 真正值得关注的东西不是单一产品,而是一个模式:Google 在用生态宽度打...
20 5 月

Qwen3.7发布:一个模型打通Agent全栈,从聊天到自主执行任务的跨越

先给判断:Qwen3.7不是一次常规的模型刷新,而是千问系列从”更好的模型”走向”更好的智能体底座”的分水岭。 5月20日上午,2026阿里云峰会上,Qwen3.7-Max正式发布。定位只有一句话:The Agent Frontier(智能体前沿)。 这不是口号。往回翻半年:3月20日 Qwen3.5-Max-Preview 打造原生多模态智能体;4月20日 Qwen3.6-Max-Preview 走向现实世界智能体;5月20日 Qwen3.7-Max 开辟智能体新前沿。月更的迭代节奏,每次的主题词都围绕Agent。这不是巧合,是路线图。 从”大脑”到”底座”:Qwen3.7在做什么不一样的事 过去说LLM是Agent的大脑——负责理解、推理、规划。但实际的Agent系统远不止这些:要调工具、要读文档、要搜网页、要生成代码工件、要跨会话记住状态。Qwen3.7-Max的目标是把这些从”外部组装”变成”模型内生”。 聊天对话:基础能力,但新的Agent场景要求对话不只是回答问题,而是推进任务图像与视频理解:原生多模态理解和推理图像生成:在同一模型内完成从理解到生成的闭环文档处理:读得懂复杂排版的PDF、表格、合同网页搜索集成:模型内建检索能力工具调用:规范的function call,兼容主流Agent框架工件生成:直接生成可运行代码、HTML页面等制品 35小时长程任务:硬件层的野心 Qwen3.7-Max在平头哥新一代训推一体AI芯片”真武M890″上,成功运行了35个小时的超长程智能体任务。LLM执行Agent任务通常会遇到”累积错误→任务崩溃”的问题,持续时间越长越明显。35小时意味着模型的指令跟随和状态管理能力达到了实用级——不是demo跑5分钟录视频,是真能撑住。 生态拼图:MSE AI调度器 同一天发布的还有阿里云的MSE AI调度器——给Agent用的”管家工具”。解决开源的Agent服务”可用性低、运维成本高、可观测性差”的问题。通过高可用分布式调度、统一管理与细粒度权限、弹性伸缩降本、全链路可观测性四招解决,已支持OpenClaw和Dify。 FAQ Qwen3.7-Max和Qwen3.7-Plus有什么区别? Max是旗舰版,参数规模更大、性能更强。Plus是性价比之选,绝大多数开发者和中小企业用Plus就够了——从历史版本看,Plus在Agent能力上不打折,只是推理速度和并发吞吐弱于Max。 Qwen3.7的跨框架支持是真的吗? 是的。官方确认无需专门训练就能在Claude Code、OpenClaw、Hermes Agent等框架中运行。但”丝滑”到什么程度——复杂任务下是否需要手动调tool schema——还需要实际项目验证。 和Claude、GPT相比,Qwen3.7的Agent能力有什么不同? 核心差异化在于”一个模型打通多模态理解+工具调用+代码生成”的全栈整合,以及与阿里云基础设施的深度绑定。如果在阿里云生态内,成本和服务一致性上有优势。 数据来源:Qwen官方博客 (https://qwen.ai/blog?id=qwen3.7)、阿里云/X、Startup Fortune、网易,2026年5月🔗 相关阅读: