28 5 月

中国 AI 的一攻一守:Qwen3.5 跑出 580 tps,Cognition 估值 260 亿美元

5月27日,两个数字——一个关于速度,一个关于金钱——同时刷新了中国 AI 的天花板。 Qwen3.5 跑出 580 tokens per second。 在 TokenSpeed 推理引擎上,针对 Agent 工作负载。这个速度由通义千问推理团队、Lightseek Foundation 的 TokenSpeed 团队、NVIDIA 和 Mooncake 联合实现,并采用了 FlashAttention-4(FA4)优化。 Cognition 估值 260 亿美元。 Devin 的母公司完成超 10 亿美元融资,Lux Capital 和 General Catalyst 领投。年化收入 4.92 亿,企业用量年初至今增长超 10 倍。 来源:X: Alibaba_Qwen /...
28 5 月

Google I/O 2026 复盘:Gemini 月活 9 亿、全栈 Agent 化、世界模型,Google 用「生态反击」回应了所有人

如果你这周只看了一场发布会,你可能会以为 Anthropic 和 OpenAI 是这个行业唯一的两个玩家。 5 月 20 日 Google I/O 把这种印象彻底打碎了。Pichai 开场用了不到 20 分钟甩出一组数字:Gemini 月活 9 亿(一年前是 4 亿),覆盖 230 个国家 70 种语言,Google Search 的 AI Mode 查询量每季度翻倍。然后才是产品:Gemini 3.5 Flash、Omni 世界模型、Spark 跨应用 Agent、Agent Payments Protocol。 但 Google I/O 2026 真正值得关注的东西不是单一产品,而是一个模式:Google 在用生态宽度打...
28 5 月

Claude Code 生态大爆发:从 v2.1.152 更新到 GitHub 全栈工具链,开发者正在给 AI 疯狂装「外挂」

如果你今天打开 GitHub Trending,会看到一副罕见的景象:前 10 名中至少有 4 个项目直接与 Claude Code 相关——ECC(19.4 万星)、claude-mem(7.8 万星)、taste-skill(2.1 万星)、Anthropic 官方的 knowledge-work-plugins(1.6 万星)。同一天,Claude Code v2.1.152 发布了。 这不是巧合。Claude Code 正在从一个「AI 编程工具」变成一个「AI 编程平台」,而开发者社区的狂热反应是最诚实的信号灯。 v2.1.152:三个看似小、实则深远的改动 先看官方更新。v2.1.152 的 changelog 不算长,但有三项改动直接指向了 Claude Code 的产品方向: /code-review --fix 落地。之前 code review 只出报告,看完了你得自己改。现在 --fix 标志会把审查建议直接应用到工作目录。这意味着 code review 从「顾问」变成了「执行者」。 Skill 的...
27 5 月

AI 视频生产三连击:Runway Luxo + Gemini Omni + Kling 同时跨过「能用」门槛

如果你对 AI 视频的印象还停留在「那些有点诡异的六指人类和违反物理定律的物体运动」,今天有三个独立信号在告诉你:可以更新认知了。 Runway Luxo:跨越恐怖谷 Runway 今天发布了 Project Luxo 的研究结果,核心结论只有一句话:AI 生成视频已经跨过了恐怖谷。 他们做了什么?向创意行业的从业者展示了包括 AI 短片《The Rogue》和广告样片在内的作品,然后评估观众的反应。结果是:观众开始关注故事本身,而不是技术瑕疵。 更有意思的是生产效率数据:所有作品都由单人团队制作,耗时从 3 周到 4 小时不等。用 Runway 的话说:「当技术足够好以至于『隐形』,观众沉浸于故事而非技术时,就意味着跨越。」 这个判断标准其实很聪明——它不是用 PSNR 或 FVD 这些技术指标来证明 AI 视频「变好了」,而是用观众的行为数据。当观众不再在弹幕里刷「AI 生成的吧」,AI 视频就真的成熟了。 Gemini Omni:不只是生成,而是「拍摄」 同一天,Google 官方发布了 Gemini Omni 的视频提示词指南。五条技巧,每一条都值得细读: 利用模型已有的现实世界知识。Gemini Omni 的训练数据包含了大量现实世界的视觉信息,你不需要描述「一辆红色的汽车长什么样」,直接说「一辆红色特斯拉 Model 3 在太平洋海岸公路上行驶」就行。 精确控制文本渲染。视频中的文字排版一直是 AI 视频的弱项,Gemini Omni 在这方面做了针对性优化,支持指定字体、位置和动效。 使用专业镜头指令。推拉摇移、景深、构图——用电影摄影师的术语来写提示词,而不是「拍得好看一点」。 迭代编辑而非重拍。不需要因为一个细节不满意就重新生成整个视频。可以像改代码一样在上一版基础上修改。 直接调整角色的动作节奏或情绪。对于叙事类内容,这个能力意味着你不需要重新设计角色动画,只需要告诉模型「让她走得更快一点」或「表情更紧张」。 这些技巧看起来简单,但背后反映的是...
27 5 月

ECC 开源项目深度拆解:19 万星的 Agent 性能调校系统,给 AI 编程装上「变速箱」

如果你用过 Claude Code 或 Codex CLI 写代码,大概率遇到过这种情况:agent 为一个简单功能读了 15 个不相关的文件,调用了 8 个不需要的工具,烧掉了一大堆 token,最后代码还没写好。 ECC 要解决的就是这个问题。 ECC 是什么? ECC 的全称很长——「The agent harness performance optimization system」(Agent 执行层性能优化系统)。简单说,它像是给 AI 编程 agent 装了一个「变速箱」和「刹车」,告诉 agent:这个场景下你只需要看这些文件、用这些工具、以这种节奏工作。 它的核心模块包括 5 个: Skills。定义 agent 在特定场景下使用的能力清单。比如「debug 模式」下 agent 可以读日志、跑测试、查看 git diff;「refactor 模式」下 agent 可以用 replace_content...