28
5 月
中国 AI 的一攻一守:Qwen3.5 跑出 580 tps,Cognition 估值 260 亿美元
5月27日,两个数字——一个关于速度,一个关于金钱——同时刷新了中国 AI 的天花板。
Qwen3.5 跑出 580 tokens per second。 在 TokenSpeed 推理引擎上,针对 Agent 工作负载。这个速度由通义千问推理团队、Lightseek Foundation 的 TokenSpeed 团队、NVIDIA 和 Mooncake 联合实现,并采用了 FlashAttention-4(FA4)优化。
Cognition 估值 260 亿美元。 Devin 的母公司完成超 10 亿美元融资,Lux Capital 和 General Catalyst 领投。年化收入 4.92 亿,企业用量年初至今增长超 10 倍。
来源:X: Alibaba_Qwen /...
28
5 月
Claude Code 自动模式搞砸了你的项目?Boris 教你 5 个步骤让它真正干活
Claude Code 创作者 Boris Cherny 分享自动模式多任务并行技巧。5 步实操指南:任务拆分→验证标准→优先级编排→并行执行→结果汇总。附 CLAUDE.md 配置模板。
27
5 月
ECC 开源项目深度拆解:19 万星的 Agent 性能调校系统,给 AI 编程装上「变速箱」
如果你用过 Claude Code 或 Codex CLI 写代码,大概率遇到过这种情况:agent 为一个简单功能读了 15 个不相关的文件,调用了 8 个不需要的工具,烧掉了一大堆 token,最后代码还没写好。
ECC 要解决的就是这个问题。
ECC 是什么?
ECC 的全称很长——「The agent harness performance optimization system」(Agent 执行层性能优化系统)。简单说,它像是给 AI 编程 agent 装了一个「变速箱」和「刹车」,告诉 agent:这个场景下你只需要看这些文件、用这些工具、以这种节奏工作。
它的核心模块包括 5 个:
Skills。定义 agent 在特定场景下使用的能力清单。比如「debug 模式」下 agent 可以读日志、跑测试、查看 git diff;「refactor 模式」下 agent 可以用 replace_content...
26
5 月
Cursor Composer 2.5 实测:一个 Kimi K2.5 微调模型,凭什么在代码基准上对标 Opus 4.7——价格只要 1/60
5 月 18 日,Cursor 发了 Composer 2.5。
没有发布会,没有博客预告。一个周日下午,版本号悄悄跳了。社区开始跑分,然后数据出来了:SWE-bench Multilingual 79.8%,比 Composer 2 高了 6 个百分点。CursorBench 默认模式下 63.2%,超过 Opus 4.7 的 61.6%。但真正让开发者社区讨论的不是分数——是价格。
Standard 模式下,每任务成本 $0.07。Opus 4.7 max 是 $4.10。差了将近 60 倍。
Key Takeaways
– Composer 2.5 SWE-bench 79.8% 对标 Opus 4.7 的 80.5%,CursorBench 默认模式 63.2%...
26
5 月
154K Star!Andrej Karpathy 用一份文件改了 Claude Code 的"脑子"
深度拆解 Andrej Karpathy 的 AI 编程洞见如何被社区转化为一份 CLAUDE.md,GitHub 154K Star。4 条原则让 Claude Code 从"闷头写"变成"会思考"。




