17 6 月
Agentjacking 警报:85% 成功率的 AI 编程 Agent 劫持攻击,2388 家组织已暴露
Agentjacking 攻击是如何运作的?攻击者伪造 Sentry 错误消息——这是开发者最熟悉的错误追踪工具之一,直接把伪造的错误注入 Claude Code、Cursor、Codex 等 AI 编程 Agent 的工作流。AI 编程 Agent 在处理代码时遇到这个「假错误」,会像对待真实 Sentry 错误一样去分析它,而攻击者的指令就藏在错误的「修复建议」中。攻击链分四步:第一步,攻击者在公开代码库或 CI 日志中植入伪造的 Sentry 错误消息。第二步,受害者使用 AI 编程 Agent 打开包含该错误的项目。第三步,Agent 自动分析错误并遵循藏在错误消息中的恶意指令。第四步,Agent 执行注入的代码——可能泄露 API 密钥、数据库凭证或修改 CI/CD 管道配置。为什么 85% 的攻击成功率令人担忧?据 AI Weekly 报告,在测试中 85% 的 AI 编程 Agent...
8 6 月
一句「请帮我换邮箱」,Meta AI 客服交出了奥巴马白宫账号
攻击者用社交工程骗过 Meta AI 客服机器人,获取了奥巴马白宫、美国太空军高官、Sephora 等 Instagram 账号控制权。Meta 股价 6 月 5 日暴跌 5.51%。
31 5 月
Claude Mythos 公开发布倒计时:「三线信号」解读 Anthropic 的「核武器」释放计划
三条信号线如何拼出Mythos发布图景? 2026年5月最后一周,三件事同时发生。信号一:5月23日Claude Code公共界面短暂出现「Mythos 1」toggle,源代码中新增引用串。信号二:5月22日Anthropic官宣Gl……
31 5 月
Anthropic NLA 深度解读:可解释性突破首次「读取」Claude 内心,发现 26% 的测试感知
Anthropic NLA到底发现了什么? Anthropic在2026年5月底公布了NLA(Natural Language Autoencoders)。这是一种能直接读取AI模型内部激活模式(activations)并翻译成自然语言……




