5 月
Claude Code 自动模式搞砸了你的项目?Boris 教你 5 个步骤让它真正干活
核心结论:Claude Code 的自动模式不是「让它自己跑就行了」,Boris Cherny 分享的并行任务技巧,才是从玩具到生产力的分水岭。
作者:智盒编辑团队 · 2026 年 5 月 26 日 · 实测环境:Claude Code v 2.1+
写这篇文章之前,我们用这套方法在一个 NestJS 项目上跑了自动模式。6 个任务——2 个 P 0(接口提取 + 编译修复),3 个 P 1(service 重构 + 测试补全),1 个 P 2(文档更新)。15 分钟后,5 个 ✅,1 个 ⚠️。那个 ⚠️ 是因为测试覆盖率差 3%,手动补两个测试用例就收工了。这套流程确实好用,前提是——你得先学会正确地给 AI 写”任务清单”。
AI 摘要
- Claude Code 创作者 Boris Cherny 公开分享了自动模式多任务并行的关键技巧
- 自动模式的核心不是”放着不管”,而是「任务拆分 + 并行编排 + 验证闭环」
- 5 个实操步骤:拆任务 → 写验证 → 设优先级 → 并行跑 → 收结果
- 附可直接复制使用的 CLAUDE.md 配置模板
适合谁读
- 已经上手 Claude Code 但自动模式总跑偏的开发者
- 想用 AI 同时处理多个开发任务(修 bug + 写测试 + 重构)的工程师
- 好奇「AI agent 到底能自动化到什么程度」的技术管理者
你遇到过吗?
打开 Claude Code,开启自动模式,丢给它一个”大任务”,然后去喝杯咖啡。
回来一看——它跑偏了。第 3 步就做了你根本没想要的改动,后续步骤在这个错误基础上越跑越远。你花的时间比省的多。
这不是自动模式的问题,是使用方式的问题。
Boris Cherny,Claude Code 的核心创作者,在 5 月 24 日的一条分享中给出了关键答案:
“自动模式的关键不是一次性丢给它所有东西,而是让它自己编排多任务并行——每个任务有独立的验证标准,完成一个交付一个。”
下面直接进入实操。
第一步:拆任务,不是按步骤拆,是按”可验证单元”拆
最常见的错误是把一个大任务拆成 A→B→C→D 的顺序步骤,然后开自动模式。结果是:B 出问题后 C 和 D 全部跑偏。
正确做法:拆成彼此独立的可验证单元。
# 错误示范(顺序依赖)
任务:重构用户模块
1. 提取 UserService 接口 ❌
2. 实现 UserServiceImpl ❌ (依赖步骤1)
3. 写 UserService 测试 ❌ (依赖步骤2)
# 正确示范(独立可验证)
任务组:用户模块重构
- 任务A:提取 UserService 接口并确保编译通过 ✓ 独立
- 任务B:为现有 UserController 补充单元测试 ✓ 独立
- 任务C:重构 UserRepository 查询逻辑并验证 ✓ 独立

第二步:每个任务必须带一个”一句话能判断的验证标准”
这是 Boris 分享中最被低估的一条。没有验证标准的自动任务 = 盲飞。
# 好的验证标准
- "npm run test:users 全部通过" ← 一行命令
- "npm run build 无错误" ← 一行命令
- "curl localhost:3000/api/users 返回 200" ← 一行命令
# 不好的验证标准
- "确保代码质量良好" ← 怎么判断?
- "用户体验应该流畅" ← AI 怎么测?
第三步:给任务打优先级标签,让 AI 自己编排
Claude Code 自动模式下,你不需要手动指定执行顺序。给每个任务打上优先级标签,AI 会自己编排。
## 自动任务清单
[P0] 修复登录 token 过期 bug → 验证:npm test -- login
[P1] 补充 PaymentService 单元测试 → 验证:npm test -- PaymentService
[P2] 更新 README 中的 API 文档 → 验证:手动 review
[P2] 清理未使用的 import → 验证:npm run lint 无新增警告

第四步:并行跑,但控制并行数
Boris 的建议:3-5 个并行任务是最佳窗口。超过 5 个,AI 的注意力会分散,质量下降。
claude --auto --max-parallel 4 "执行 @tasks.md 中的所有任务"
第五步:收结果——只看失败的任务
自动模式跑完后,不需要检查每个任务的输出。Claude Code 会在结束时汇总:
✅ 4 tasks completed
⚠️ 1 task needs review: "升级 prisma 到最新" — 编译通过但 2 个测试失败
关键心态转变:你不是在检查 AI 有没有做对,你是在处理 AI 明确标记为”需要人类判断”的例外。这让你从”审批者”变成了”决策者”。
实战:把 5 步串起来的完整 CLAUDE.md 模板
## 自动任务模式
当使用自动模式时,遵循以下规则:
1. 任务拆分 — 将大任务拆分为独立可验证的子任务,按 P0/P1/P2 标记优先级
2. 验证标准 — 每个任务必须定义一个可机器执行的验证命令
3. 并行编排 — P0 优先执行,同优先级任务可并行,最多 4 个并行
4. 输出汇总 — 完成后输出 ✅/⚠️ 状态,仅失败任务需要手动 review
5. 失败不传播 — 一个任务失败不阻塞其他独立任务的执行
一个真实案例
用户模块重构——涉及 3 个 service、2 个 controller、1 套测试。传统方式半天逐个文件改。
用这套 5 步流程:
- 拆分(2 分钟):拆成 6 个独立任务
- 写验证(2 分钟):每个任务配验证命令
- 设优先级(30 秒):标 P 0/P 1/P 2
- 并行跑(自动模式,10-15 分钟)
- 收结果(5 分钟):5 个 ✅,1 个 ⚠️
总计:你花了不到 10 分钟,AI 完成了 90% 的工作。
风险与限制
- 自动模式消耗更多 token — 并行意味着多个任务同时占用上下文
- 不适合强耦合任务 — 如果任务之间有复杂的数据依赖
- 验证标准不能覆盖一切 — UI 变更、架构决策需人工判断
- 需要一定的 prompt 设计能力 — 任务描述质量直接决定执行质量
FAQ
自动模式和普通模式有什么区别?
普通模式是你和 Claude Code 一问一答。自动模式是你给一个任务清单,它自己编排、执行、验证。
自动模式会不会把代码改坏?
有验证标准就不会。每个任务跑完后自动执行验证命令,不通过的任务会被标记 ⚠️。
并行任务的顺序有保证吗?
P 0 优先于 P 1 优先于 P 2。同一优先级内,AI 自己决定执行顺序。
适合什么类型的项目?
任何有自动化测试的项目都适合。没有测试的项目也能用,但验证标准需依赖编译检查、lint 检查等手段。
