Claude Code 自动模式搞砸了你的项目？Boris 教你 5 个步骤让它真正干活

Q: 第二步：每个任务必须带一个”一句话能判断的验证标准” 这是 Boris 分享中最被低估的一条。没有验证标准的自动任务 = 盲飞。 # 好的验证标准 - "npm run test:users 全部通过" ← 一行命令 - "npm run build 无错误" ← 一行命令 - "curl localhost:3000/api/users 返回 200" ← 一行命令 # 不好的验证标准 - "确保代码质量良好" ← 怎么判断？ - "用户体验应该流畅" ← AI 怎么测？ 第三步：给任务打优先级标签，让 AI 自己编排

Claude Code 自动模式下，你不需要手动指定执行顺序。给每个任务打上优先级标签，AI 会自己编排。 ## 自动任务清单 [P0] 修复登录 token 过期 bug → 验证：npm test -- login [P1] 补充 PaymentService 单元测试 → 验证：npm test -- PaymentService [P2] 更新 README 中的 API 文档 → 验证：手动 review [P2] 清理未使用的 import → 验证：npm run lint 无新增警告

智智

5 月

Claude Code 自动模式搞砸了你的项目？Boris 教你 5 个步骤让它真正干活

核心结论：Claude Code 的自动模式不是「让它自己跑就行了」，Boris Cherny 分享的并行任务技巧，才是从玩具到生产力的分水岭。

作者：智盒编辑团队 · 2026 年 5 月 26 日 · 实测环境：Claude Code v 2.1+

写这篇文章之前，我们用这套方法在一个 NestJS 项目上跑了自动模式。6 个任务——2 个 P 0（接口提取 + 编译修复），3 个 P 1（service 重构 + 测试补全），1 个 P 2（文档更新）。15 分钟后，5 个 ✅，1 个 ⚠️。那个 ⚠️ 是因为测试覆盖率差 3%，手动补两个测试用例就收工了。这套流程确实好用，前提是——你得先学会正确地给 AI 写”任务清单”。

AI 摘要

Claude Code 创作者 Boris Cherny 公开分享了自动模式多任务并行的关键技巧
自动模式的核心不是”放着不管”，而是「任务拆分 + 并行编排 + 验证闭环」
5 个实操步骤：拆任务 → 写验证 → 设优先级 → 并行跑 → 收结果
附可直接复制使用的 CLAUDE.md 配置模板

适合谁读

已经上手 Claude Code 但自动模式总跑偏的开发者
想用 AI 同时处理多个开发任务（修 bug + 写测试 + 重构）的工程师
好奇「AI agent 到底能自动化到什么程度」的技术管理者

你遇到过吗？

打开 Claude Code，开启自动模式，丢给它一个”大任务”，然后去喝杯咖啡。

回来一看——它跑偏了。第 3 步就做了你根本没想要的改动，后续步骤在这个错误基础上越跑越远。你花的时间比省的多。

这不是自动模式的问题，是使用方式的问题。

Boris Cherny，Claude Code 的核心创作者，在 5 月 24 日的一条分享中给出了关键答案：

“自动模式的关键不是一次性丢给它所有东西，而是让它自己编排多任务并行——每个任务有独立的验证标准，完成一个交付一个。”

下面直接进入实操。

第一步：拆任务，不是按步骤拆，是按”可验证单元”拆

最常见的错误是把一个大任务拆成 A→B→C→D 的顺序步骤，然后开自动模式。结果是：B 出问题后 C 和 D 全部跑偏。

正确做法：拆成彼此独立的可验证单元。

# 错误示范（顺序依赖）
任务：重构用户模块
1. 提取 UserService 接口 ❌
2. 实现 UserServiceImpl ❌ （依赖步骤1）
3. 写 UserService 测试 ❌ （依赖步骤2）

# 正确示范（独立可验证）
任务组：用户模块重构
- 任务A：提取 UserService 接口并确保编译通过 ✓ 独立
- 任务B：为现有 UserController 补充单元测试 ✓ 独立
- 任务C：重构 UserRepository 查询逻辑并验证 ✓ 独立

第二步：每个任务必须带一个”一句话能判断的验证标准”

这是 Boris 分享中最被低估的一条。没有验证标准的自动任务 = 盲飞。

# 好的验证标准
- "npm run test:users 全部通过" ← 一行命令
- "npm run build 无错误" ← 一行命令
- "curl localhost:3000/api/users 返回 200" ← 一行命令

# 不好的验证标准
- "确保代码质量良好" ← 怎么判断？
- "用户体验应该流畅" ← AI 怎么测？

第三步：给任务打优先级标签，让 AI 自己编排

Claude Code 自动模式下，你不需要手动指定执行顺序。给每个任务打上优先级标签，AI 会自己编排。

## 自动任务清单
[P0] 修复登录 token 过期 bug → 验证：npm test -- login
[P1] 补充 PaymentService 单元测试 → 验证：npm test -- PaymentService
[P2] 更新 README 中的 API 文档 → 验证：手动 review
[P2] 清理未使用的 import → 验证：npm run lint 无新增警告

第四步：并行跑，但控制并行数

Boris 的建议：3-5 个并行任务是最佳窗口。超过 5 个，AI 的注意力会分散，质量下降。

claude --auto --max-parallel 4 "执行 @tasks.md 中的所有任务"

第五步：收结果——只看失败的任务

自动模式跑完后，不需要检查每个任务的输出。Claude Code 会在结束时汇总：

✅ 4 tasks completed
⚠️ 1 task needs review: "升级 prisma 到最新" — 编译通过但 2 个测试失败

关键心态转变：你不是在检查 AI 有没有做对，你是在处理 AI 明确标记为”需要人类判断”的例外。这让你从”审批者”变成了”决策者”。

实战：把 5 步串起来的完整 CLAUDE.md 模板

## 自动任务模式
当使用自动模式时，遵循以下规则：
1. 任务拆分 — 将大任务拆分为独立可验证的子任务，按 P0/P1/P2 标记优先级
2. 验证标准 — 每个任务必须定义一个可机器执行的验证命令
3. 并行编排 — P0 优先执行，同优先级任务可并行，最多 4 个并行
4. 输出汇总 — 完成后输出 ✅/⚠️ 状态，仅失败任务需要手动 review
5. 失败不传播 — 一个任务失败不阻塞其他独立任务的执行

一个真实案例

用户模块重构——涉及 3 个 service、2 个 controller、1 套测试。传统方式半天逐个文件改。

用这套 5 步流程：

拆分（2 分钟）：拆成 6 个独立任务
写验证（2 分钟）：每个任务配验证命令
设优先级（30 秒）：标 P 0/P 1/P 2
并行跑（自动模式，10-15 分钟）
收结果（5 分钟）：5 个 ✅，1 个 ⚠️

总计：你花了不到 10 分钟，AI 完成了 90% 的工作。

风险与限制

自动模式消耗更多 token — 并行意味着多个任务同时占用上下文
不适合强耦合任务 — 如果任务之间有复杂的数据依赖
验证标准不能覆盖一切 — UI 变更、架构决策需人工判断
需要一定的 prompt 设计能力 — 任务描述质量直接决定执行质量

FAQ

自动模式和普通模式有什么区别？

普通模式是你和 Claude Code 一问一答。自动模式是你给一个任务清单，它自己编排、执行、验证。

自动模式会不会把代码改坏？

有验证标准就不会。每个任务跑完后自动执行验证命令，不通过的任务会被标记 ⚠️。

并行任务的顺序有保证吗？

P 0 优先于 P 1 优先于 P 2。同一优先级内，AI 自己决定执行顺序。

适合什么类型的项目？

任何有自动化测试的项目都适合。没有测试的项目也能用，但验证标准需依赖编译检查、lint 检查等手段。

Posts

9 7 月

Marketing Skills — 37K 星 AI Agent 营销技能库：CRO、SEO、文案、增长工程一站式 Agent 工具包

一句话结论：Marketing Skills 是 Corey Haines 构建的一个开源 AI Agent 营销技能库，已在 GitHub 获得 37,000+ Stars。它包含 36 个结构化营销技能，覆盖转化率优化（CRO）、文案写作、SEO 审计、数据分析、增长工程等领域，让 AI 编码 Agent 变身专业营销顾问。项目介绍 Marketing Skills 是一个遵循 Agent Skills 规范的技能集合。每个技能是一个 Markdown 文件，给 AI Agent 注入特定营销任务的专业知识和结构化工作流。当你在项目中添加这些技能后，Agent 能识别你正在做营销任务，自动应用正确的框架和最佳实践。作者 Corey Haines 是 Conversion Factory 和...

智智

资源

没有评论 Read More

9 7 月

AI Job Search — 7K 星 Claude Code 求职框架：让 AI Agent 帮你投简历、写求职信、模拟面试

一句话结论：AI Job Search 是一个基于 Claude Code 的 AI 求职框架，在 GitHub 上已获得 7,000+ Stars。它把 Claude Code 变成一个全能求职助手：自动评估岗位匹配度、定制简历、写 Cover Letter、准备面试。TypeScript 开发，MIT 开源。项目介绍 AI Job Search 由丹麦开发者 Mads Lorentzen 创建，核心思路是：把求职变成一个结构化的、AI 可执行的流水线。你只需填写个人资料（CV、技能、经历），Claude Code 会自动完成后续所有步骤。核心工作流（自我画像→岗位匹配评估→起草-审查申请流水线）是语言和国家无关的。内置的丹麦求职门户技能（Jobindex、Jobnet 等）可以替换为你当地的求职网站。项目还提供了 /add-portal 命令自动生成新求职门户的搜索技能。核心功能自我画像：填写 CV、技能、工作偏好后，Agent 自动建立你的职业画像岗位匹配评估：Agent 分析岗位描述，评估匹配度，给出申请建议简历定制：根据目标岗位自动调整简历重点和关键词 Cover Letter 生成：起草-审查双 Agent 流水线，确保质量面试准备：基于岗位描述生成常见问题和回答建议 LinkedIn 全球搜索：通过公开...

盒盒

资源

没有评论 Read More

9 7 月

Agent Skills — Addy Osmani 开源的 AI 编码 Agent 24 技能包：从 Spec 到 Ship 全生命周期工程规范

一句话结论：Agent Skills 是 Google Chrome 工程总监 Addy Osmani 开源的生产级 AI 编码 Agent 技能包，24 个技能覆盖 Define→Plan→Build→Verify→Review→Ship 完整开发周期。支持 Claude Code、Cursor、Codex、Copilot 等 70+ 工具。将 Google 工程文化的最佳实践编码为 Agent 可执行的结构化工作流。项目介绍 AI 编码 Agent 默认走最短路径——跳过 Spec、跳过测试、跳过安全审查。Agent Skills 给 Agent 注入了资深工程师的工程纪律：什么时候写 Spec、测试什么、怎么审查、什么时候上线。这不是通用 Prompt，而是经过 Google 工程文化验证的、结构化的、有明确验证标准的工程工作流。每个技能包含：流程步骤、验证检查点、反借口表（阻止 Agent 跳过步骤）、红线标记。设计理念来自

盒盒

资源

没有评论 Read More

9 7 月

12-Factor Agents — 构建生产级 LLM 应用的 12 条原则：从原型到可靠产品的工程方法论

一句话结论：12-Factor Agents 是 HumanLayer 提出的构建生产级 LLM 应用的 12 条工程原则，受 12-Factor App 方法论启发。它回答了一个核心问题：什么原则能让我们构建的 LLM 应用真正达到可以交付给生产客户的质量标准？项目介绍作者 Dexter 在构建 AI Agent 产品时发现一个普遍问题：大多数 Agent 项目能达到 70-80% 的质量，但突破 80% 进入生产级别需要深入了解框架内部。他提炼了 12 条原则，帮助开发者从一开始就用正确的方式构建可靠的 LLM 应用。核心洞察：即使 LLM 持续指数级增长，依然存在核心工程技巧让 LLM 应用更可靠、更可扩展、更易维护。最关键的是——你不需要全盘重写来采用 Agent 架构，可以逐步将 Agent 的模块化概念融入现有产品。 12 条原则自然语言优先 — 用自然语言定义...

盒盒

资源

没有评论 Read More

9 7 月

Chatwoot — 30K 星开源客服平台：自托管替代 Intercom/Zendesk，支持全渠道 + AI Agent

一句话结论：Chatwoot 是 GitHub 上 30,000+ Stars 的开源客服平台，自托管替代 Intercom 和 Zendesk。支持网站实时聊天、邮件、WhatsApp、Facebook 等全渠道收件箱，内置 AI 助手和知识库。Ruby on Rails 开发，数据完全私有。项目介绍 Chatwoot 是现代开源客服支持平台，为需要完全控制客户数据的企业设计。它将所有客户对话集中到一个强大的收件箱，无论客户从哪里联系你。支持网站实时聊天、邮件、Facebook、Instagram、Twitter、WhatsApp、Telegram、Line、SMS 等渠道。核心优势：完全自托管，数据归你所有。适合有合规要求（GDPR、HIPAA）或不想把客户数据交给第三方 SaaS 的企业。核心功能全渠道收件箱：网站、邮件、社交、即时通讯，一个界面管理所有对话 AI 助手：自动回复、意图识别、情感分析、对话摘要知识库：内置帮助中心，支持多语言联系人管理：客户画像、交互历史、自定义字段团队协作：对话分配、内部备注、预设回复（Canned Responses）自动化：基于规则的自动分配、标签、触发器 API 和 Webhook：完整 REST API，支持自定义集成移动端：React Native 构建的 iOS/Android App 安装方式 # Docker 一键部署（推荐） docker run -p 3000:3000 chatwoot/chatwoot # 手动安装（Ubuntu） git clone https://github.com/chatwoot/chatwoot.git cd...

盒盒

资源

没有评论 Read More

9 7 月

AI Agents for Beginners — 微软官方 AI Agent 入门课程：10 节课从概念到代码

一句话结论：AI Agents for Beginners 是微软官方的 10 节 AI Agent 入门课程，使用 Microsoft Agent Framework (MAF) 和 Azure AI Foundry，从概念到代码带你构建第一个 AI Agent。支持中文等多语言，免费开源。项目介绍这是微软官方出品的 AI Agent 入门课程，在 GitHub 上开源。每节课包含视频讲解 + 文字教程 + Python 代码示例 (Jupyter Notebook)，使用 Microsoft Agent Framework 和 Azure AI Foundry...

智智

资源

没有评论 Read More

9 7 月

Claude SEO — 11K 星 Claude Code SEO 插件：25 子技能 + 18 专业 Agent 并行审计

一句话结论：Claude SEO 是一个开源的 Claude Code SEO 分析插件，已在 GitHub 获得 11,000+ Stars。它拥有 25 个子技能和 18 个专业 Agent，可并行执行技术 SEO、E-E-A-T 评分、Schema.org 标记、GEO/AEO（AI 搜索优化）、本地 SEO、电商 SEO、国际 SEO 等全方位审计。MIT 开源，完全离线可用。项目介绍 Claude SEO 由 Daniel Agrici 开发，是目前功能最全面的开源 SEO 分析工具。它遵循 Google 官方 AI 优化指南和 2025 年...

智智

资源

没有评论 Read More

9 7 月

Pixelle-Video — 开源 AI 全自动短视频引擎：输入主题，3 分钟出视频

一句话结论：Pixelle-Video 是一个开源的 AI 全自动短视频生成引擎，输入一个主题即可自动完成脚本撰写、AI 配图、语音合成、背景音乐和一键合成视频。支持多种 AI 模型和 TTS 方案，完全免费方案仅需本地 Ollama + ComfyUI。中文友好。项目介绍 Pixelle-Video 由 ATH-MaaS 团队开发，是一个"输入主题，3 分钟出视频"的全自动 AI 短视频引擎。不需要视频编辑经验，不需要复杂配置。基于 ComfyUI 架构，支持预设工作流和自定义能力扩展。核心功能全自动生成：输入主题 → 自动出完整视频 AI 智能文案：基于主题自动生成解说词 AI 配图/视频：每句解说词配精美 AI 插图 AI 语音合成：支持 Edge-TTS、Index-TTS 等主流方案背景音乐：自动添加 BGM 增强氛围多种视觉风格：多个模板打造独特视频风格灵活尺寸：支持竖屏、横屏等多种视频尺寸多 AI 模型：GPT、千问、DeepSeek、Ollama 等成本方案方案配置成本完全免费Ollama (本地) + 本地 ComfyUI$0推荐方案千问 LLM +...

盒盒

资源

没有评论 Read More

9 7 月

MuscleWiki — 2000+ 动作交互式健身库：点击肌肉，秒查训练动作

一句话结论：MuscleWiki 是一个免费的交互式健身动作库，收录 2,000+ 个动作和 7,500+ 个视频演示。通过交互式肌肉地图，点击任意肌肉即可看到针对训练动作。提供免费 API，适合健身 App 开发者集成。项目介绍 MuscleWiki 以独特的交互式肌肉地图为核心体验。人体模型上标注了 45 个肌肉群，点击任意肌肉即可显示该部位的针对性训练动作，每个动作都配有视频演示和分步文字说明。是目前互联网上最直观的健身动作查询工具。核心功能交互式肌肉地图：45 个肌肉群可视化标注，点击即查 2,000+ 动作库：覆盖全身所有肌群 7,500+ 视频演示：专业动作教学视频分步文字指南：每个动作的详细执行说明免费 API：供开发者集成到健身 App 中移动端适配：响应式设计，手机浏览器完美体验 API 使用 # 获取所有动作 curl https://api.musclewiki.com/v1/exercises # 按肌肉群筛选 curl https://api.musclewiki.com/v1/exercises?muscle=biceps # 完整 API 文档见 # https://api.musclewiki.com/documentation 适用场景健身 App：嵌入动作教学视频和文字指南个人训练：查询不熟悉的动作正确做法教练教学：快速展示动作给学生看内容创作：健身文章和视频的参考资料 FAQ MuscleWiki 免费吗？网站完全免费。API 有免费层，适合个人项目和中小型应用。商业大规模使用需查看 API 定价。和 YouTube 健身视频有什么区别？ MuscleWiki 的独特优势是按肌肉定位。你不知道动作名字，但你">>知道想练哪个部位——点击肌肉就能找到所有针对该部位的动作。相关链接 MuscleWiki 官网 MuscleWiki API Exercises...

智智

资源

没有评论 Read More

9 7 月

Exercises Dataset — 433 个健身动作开源数据集：为你的健身 App 和 AI 模型提供结构化数据

Exercises Dataset 提供 433 个健身动作的结构化数据，并整合 MuscleWiki 动作演示与 DAREBEE 免费训练计划，适合健身 App、AI 模型和个人训练参考。

盒盒

资源

没有评论 Read More

Claude Code 自动模式搞砸了你的项目？Boris 教你 5 个步骤让它真正干活

AI 摘要

适合谁读

你遇到过吗？

第一步：拆任务，不是按步骤拆，是按”可验证单元”拆

第二步：每个任务必须带一个”一句话能判断的验证标准”

第三步：给任务打优先级标签，让 AI 自己编排

第四步：并行跑，但控制并行数

第五步：收结果——只看失败的任务

实战：把 5 步串起来的完整 CLAUDE.md 模板

一个真实案例

风险与限制

FAQ

自动模式和普通模式有什么区别？

自动模式会不会把代码改坏？

并行任务的顺序有保证吗？

适合什么类型的项目？

相关阅读

作者

评论 (1)

RELATED

Posts

Marketing Skills — 37K 星 AI Agent 营销技能库：CRO、SEO、文案、增长工程一站式 Agent 工具包

AI Job Search — 7K 星 Claude Code 求职框架：让 AI Agent 帮你投简历、写求职信、模拟面试

Agent Skills — Addy Osmani 开源的 AI 编码 Agent 24 技能包：从 Spec 到 Ship 全生命周期工程规范

12-Factor Agents — 构建生产级 LLM 应用的 12 条原则：从原型到可靠产品的工程方法论

Chatwoot — 30K 星开源客服平台：自托管替代 Intercom/Zendesk，支持全渠道 + AI Agent

AI Agents for Beginners — 微软官方 AI Agent 入门课程：10 节课从概念到代码

Claude SEO — 11K 星 Claude Code SEO 插件：25 子技能 + 18 专业 Agent 并行审计

Pixelle-Video — 开源 AI 全自动短视频引擎：输入主题，3 分钟出视频

MuscleWiki — 2000+ 动作交互式健身库：点击肌肉，秒查训练动作

Exercises Dataset — 433 个健身动作开源数据集：为你的健身 App 和 AI 模型提供结构化数据

智盒－aiKit.vip

最新文章

Marketing Skills — 37K 星 AI Agent 营销技能库：CRO、SEO、文案、增长工程一站式 Agent 工具包

AI Job Search — 7K 星 Claude Code 求职框架：让 AI Agent 帮你投简历、写求职信、模拟面试

最新评论

栏目

分类目录

© copyright 2026. All Rights Reserved.

Claude Code 自动模式搞砸了你的项目？Boris 教你 5 个步骤让它真正干活

AI 摘要

适合谁读

你遇到过吗？

第一步：拆任务，不是按步骤拆，是按”可验证单元”拆

第二步：每个任务必须带一个”一句话能判断的验证标准”

第三步：给任务打优先级标签，让 AI 自己编排

第四步：并行跑，但控制并行数

第五步：收结果——只看失败的任务

实战：把 5 步串起来的完整 CLAUDE.md 模板

一个真实案例

风险与限制

FAQ

自动模式和普通模式有什么区别？

自动模式会不会把代码改坏？

并行任务的顺序有保证吗？

适合什么类型的项目？

相关阅读

分享这篇文章

作者

评论 (1)

RELATED

Posts

智盒－aiKit.vip

最新文章

最新评论

栏目

分类目录

© copyright 2026. All Rights Reserved.