28 5 月

AI 编程 Agent 找到了 PMF——然后定价体系就崩了

一天之内,三件事拼出了一幅完整的图。 Simon Willison 写了一篇博客,标题平淡——《I think Anthropic and OpenAI have found product-market fit》——在 Hacker News 上拿了 638 分。Sam Altman 接受采访时说「AI 对白领冲击不如预期般严重,我很高兴自己当时错了」。Cognition(Devin 的母公司)宣布估值 260 亿美元,年化收入 4.92 亿。 三件事单独看都是新闻,放在一起是一个信号:AI 编程 Agent 找到了 PMF——然后定价规则被重新发明了。 从「无限畅吃」到「按克收费」 Simon Willison 的文章里列出了具体的时间线和数字: 2026 年 4 月前后,Anthropic 和 OpenAI 同时调整了企业套餐定价。此前,两家公司的企业版采用大幅折扣策略——一个固定月费,基本上可以「无限」使用 Claude Code 或 Codex。调整后: Anthropic...
28 5 月

Claude Code 生态大爆发:从 v2.1.152 更新到 GitHub 全栈工具链,开发者正在给 AI 疯狂装「外挂」

如果你今天打开 GitHub Trending,会看到一副罕见的景象:前 10 名中至少有 4 个项目直接与 Claude Code 相关——ECC(19.4 万星)、claude-mem(7.8 万星)、taste-skill(2.1 万星)、Anthropic 官方的 knowledge-work-plugins(1.6 万星)。同一天,Claude Code v2.1.152 发布了。 这不是巧合。Claude Code 正在从一个「AI 编程工具」变成一个「AI 编程平台」,而开发者社区的狂热反应是最诚实的信号灯。 v2.1.152:三个看似小、实则深远的改动 先看官方更新。v2.1.152 的 changelog 不算长,但有三项改动直接指向了 Claude Code 的产品方向: /code-review --fix 落地。之前 code review 只出报告,看完了你得自己改。现在 --fix 标志会把审查建议直接应用到工作目录。这意味着 code review 从「顾问」变成了「执行者」。 Skill 的...
26 5 月

Cursor Composer 2.5 实测:一个 Kimi K2.5 微调模型,凭什么在代码基准上对标 Opus 4.7——价格只要 1/60

5 月 18 日,Cursor 发了 Composer 2.5。 没有发布会,没有博客预告。一个周日下午,版本号悄悄跳了。社区开始跑分,然后数据出来了:SWE-bench Multilingual 79.8%,比 Composer 2 高了 6 个百分点。CursorBench 默认模式下 63.2%,超过 Opus 4.7 的 61.6%。但真正让开发者社区讨论的不是分数——是价格。 Standard 模式下,每任务成本 $0.07。Opus 4.7 max 是 $4.10。差了将近 60 倍。 Key Takeaways – Composer 2.5 SWE-bench 79.8% 对标 Opus 4.7 的 80.5%,CursorBench 默认模式 63.2%...
26 5 月

154K Star!Andrej Karpathy 用一份文件改了 Claude Code 的"脑子"

深度拆解 Andrej Karpathy 的 AI 编程洞见如何被社区转化为一份 CLAUDE.md,GitHub 154K Star。4 条原则让 Claude Code 从"闷头写"变成"会思考"。
25 5 月

Cursor 3.3 vs Claude Code 2.1:我在两个工具上分别写了 6 个 PR,结论和你想的不一样

2026年5月,AI编程工具的战场正在发生一件微妙的事:它们不再互相替代,而是开始分工。 70%的专业开发者现在同时使用2-4个AI编程工具(Silverthread Labs, 2026年3月)。Claude Code 在 2025 年 State of Code 调查中以57%的使用率排名第一,Cursor 以43%紧随其后。Claude Code 以91%的满意度(CSAT)和NPS 54领先——JetBrains 2026年1月的万人调查显示,这两个工具的工作场所采用率已经完全持平(各18%)。 我们在两个工具上分别完成了6个相同的PR——从简单的 utility 函数到跨模块重构。结论和主流观点有点不一样。 Key Takeaways– Claude Code 在复杂多文件任务上首遍准确率达78%,比 Cursor 高5个百分点(SitePoint Benchmark, 2026)– Cursor 在简单高频任务上性价比胜出:42分/美元 vs Claude Code 的31分/美元(SitePoint,...