29 5 月

星巴克 AI 翻车实录:一个 99% 准确率的模型,为什么在 11,000 家门店被集体拔线?

试点成功的 AI 系统 ≈ 一个闭卷考满分的实习生进了真实仓库——问题不在模型,在现实世界的方差。拆解星巴克 AI 失败的三个致命陷阱及企业部署必备的三个护栏。
29 5 月

Agent 安全的「宪法时刻」:Anthropic 零信任框架 + OpenAI 私有 MCP + 教皇通谕,同一天三线交汇

5月27日,三件事在同一天发生。它们分属不同领域——安全技术、企业基础设施、宗教伦理——但底层指向同一个问题:当 AI Agent 能自主决策、执行代码、操作生产环境时,安全不再是一个功能需求,而是生存前提。 第一块拼图:Anthropic 的零信任框架 Anthropic 在这一天发布了针对企业部署自主 AI Agent 的安全框架。这不是一篇泛泛而谈的白皮书——它包含了一个分层的三层架构(基础、高级、优化级)和一个八阶段实施流程。 文章的核心判断很直白: 「前沿大语言模型正将漏洞利用周期从数月压缩至数小时。」 换句话说,如果一个漏洞过去给你 90 天修复窗口,现在可能只有几个小时——因为 AI 加速了攻击端的能力,而防守端还在用传统节奏。 框架首次系统性地建模了 Agent 特有的威胁类别:提示注入(prompt injection)、工具投毒(tool poisoning)、记忆投毒(memory poisoning)。这三个威胁在传统 Web 安全或 API 安全的语境中不存在——它们是 Agent 自治能力带来的全新攻击面。 提示注入:攻击者通过精心构造的输入,让 Agent 执行非预期操作。传统 XSS/SQL 注入的攻击对象是应用程序,而提示注入的攻击对象是 LLM 的推理链路。 工具投毒:如果 Agent 可以调用外部 MCP 服务器或 API,攻击者可以通过篡改工具返回的数据来影响 Agent 的决策。这在传统 API 安全中对应的是供应链攻击,但 Agent...
29 5 月

MCP 的三个「第一次」:OpenAI 企业级安全连接、Runway 视频生成接入、Perplexity 分词器开源

Model Context Protocol(MCP)是 Anthropic 在 2024 年底推出的开放协议,用于让 AI 模型连接外部工具和数据源。推出时大多数人的反应是「又一个协议」。 一年半后的今天,MCP 的生态已经发生了根本变化。而 2026 年 5 月 27 日,可能是 MCP 历史上最重要的一天——三个「第一次」在同一天完成。 1. 第一次企业级安全连接 OpenAI 发布了一个看似简单的功能——「私人 MCP 服务器的安全连接」——但细节决定了它的意义: 「你的团队保持 MCP 服务器在你的网络内,ChatGPT、Codex 和 Responses API 通过仅出站 HTTPS 连接。」 这句话的关键词是「仅出站」(outbound-only)。 传统上,企业将内部服务暴露给外部 AI 厂商需要做隧道、VPN、甚至是防火墙规则修改。安全团队最怕的就是在防火墙上开新的入站端口。OpenAI 的方案绕过了整个问题:Agent 主动用 HTTPS 连接 MCP 服务器,不需要企业接受任何入站流量。 这背后是一个行业趋势:MCP 正在从 Claude...
28 5 月

AI 编程 Agent 找到了 PMF——然后定价体系就崩了

一天之内,三件事拼出了一幅完整的图。 Simon Willison 写了一篇博客,标题平淡——《I think Anthropic and OpenAI have found product-market fit》——在 Hacker News 上拿了 638 分。Sam Altman 接受采访时说「AI 对白领冲击不如预期般严重,我很高兴自己当时错了」。Cognition(Devin 的母公司)宣布估值 260 亿美元,年化收入 4.92 亿。 三件事单独看都是新闻,放在一起是一个信号:AI 编程 Agent 找到了 PMF——然后定价规则被重新发明了。 从「无限畅吃」到「按克收费」 Simon Willison 的文章里列出了具体的时间线和数字: 2026 年 4 月前后,Anthropic 和 OpenAI 同时调整了企业套餐定价。此前,两家公司的企业版采用大幅折扣策略——一个固定月费,基本上可以「无限」使用 Claude Code 或 Codex。调整后: Anthropic...
28 5 月

FastVideo Dreamverse 开源:一张 B200,7 秒生成 30 秒高清视频

实时视频生成又多了一个开源选项。Sky Computing Lab 在 5 月 27 日开源了 FastVideo Dreamverse——基于单张 NVIDIA B200 GPU 和 LTX-2 模型,实现实时视频生成的氛围引导工具。核心数字:7 秒生成 30 秒 1080p 视频。 来源:X: @haoailab / GitHub / Blog 为什么重要 实时视频生成有三个关键门槛:速度(不能等几分钟)、质量(1080p 是底线)、硬件成本(能不能跑在单卡上)。FastVideo Dreamverse 三个都过了。 对比一下同一天 Runway 发布的 MCP 服务器——Runway 走的是云端 API 路线,FastVideo 走的是本地开源路线。前者方便但花钱,后者需要硬件但免费。 技术栈 GPU:NVIDIA...