2026年05月16日

by smallnest

PRD → Goal → After-Goal：AI 辅助全流程研发实践

想给大模型训推任务灵犀诊断平台增加「自我演化」的功能，尝试使用claude code的最新的/goal命令，记录从需求拆解到代码合入的完整流程，供同学参考。

最近两周codex、hermes相继发布/goal斜杠命令,这一周 claude code也不甘示弱，跨速发布了它的 /goal 斜杠命令。本文将/goal斜杠命令 + /prd技能 + /after-goal技能，实现了一个产品特性研发全自动化的流程，探索出一个AI+实践的新案例。

背景

01-背景

在百度内部研发场景中，一个功能从需求到上线通常经历：写 PRD → 拆卡片 → 写代码 → 提 CR → 合入 → 关卡片。这套流程环节多、工具分散（iCafe、iCode、Gerrit），每一步都要手动操作，容易遗漏步骤。

借助 Claude Code 的 Skill 机制，我们可以将这套流程固化成三个阶段，每个阶段对应一个 Slash Command：

阶段	命令	做什么
需求拆解	`/prd`	生成 PRD 文档，拆分为可实现的 iCafe 卡片

下面用一次真实开发过程，演示这三个阶段如何串起来。

第一阶段：/prd — 需求拆解

02-第一阶段：prd — 需求拆解

做了什么

使用 /prd 将「诊断案例记录与反馈闭环」这一产品需求，生成结构化 PRD 文档：

它需要我澄清一些东西，这次我没有做它的选择题，我认为我描述会更清楚，所以我直接告诉它我模糊的想法，它就实现了产品需求文档的编写：

PRD 文档自动保存到 tasks/prd-self-evolution.md，卡片自动创建到 iCafe 空间，标题、描述、验收标准、优先级一应俱全。

并拆分为 5 张 iCafe 卡片，然后询问我卡片创建在哪里，我选择icafe,然后它就帮我创建好了：

我们可以看一个它创建的卡片，主要包括此任务的描述信息、验收标准以及卡片依赖关系：

为什么要先写 PRD

直接让 AI 写代码，容易出现需求理解偏差、边界条件遗漏。PRD 强制你先想清楚：

有哪些用户故事？每个的验收标准是什么？
哪些是 Non-Goal（明确不做的事）？
卡片之间的依赖关系是什么？实现顺序怎么排？

PRD 写完后再拆卡片，每个卡片的范围足够小、验收标准足够明确，AI 才能高效实现。

而且，卡片如此定义之后，就可以很好的配合使用claude code的 /goal命令或者 codex的 /goal命令了：

卡片任务明确可操作：/goal 就可以2按照要求准确的实现
卡片有验收标准：/goal 就可以写单元测试，保证它实现的代码符合需求
卡片有依赖关系：/goal 可以按照顺序有序的实现功能
卡片足够小：/goal 就可以快速实现快速反馈，避免长时间占用资源和死循环

第二阶段：/goal — 逐卡实现

03-第二阶段：goal — 逐卡实现

卡片 46：Case 数据模型与 Markdown 读写库

1	/goal 实现卡片 baidu-sys-nccl-sys-skills-46

Claude Code 自动完成了以下工作：

查询卡片：用 icafe-cli card get 获取卡片描述和验收标准
理解上下文：阅读 diag/CLAUDE.md（项目架构文档）、diag/model/types.go（现有类型定义）
实现代码：创建 diag/cases/case.go，定义 Case struct，实现 YAML frontmatter + Markdown body 的序列化/反序列化，提供 WriteCase/ReadCase/ListCases/UpdateCase 四个核心函数
编写测试：创建 diag/cases/case_test.go，10 个测试覆盖 round-trip 序列化、文件读写、列表过滤、部分更新、空结果、特殊字符、错误场景
验证：go vet、go build、go test ./diag/... 全部通过

/goal 只负责实现卡片。卡片的代码提交和卡片的更新它不负责，所以我实现了这个卡片后，手工指导claude code使用icode-cli实现代码，并且把实现summary更新到卡片的描述字段中：

然后我把这个流程作为经验，让claude code帮我实现了一个 after-goal的skill,负责提交代码、review打分、代码合入、更新卡片和关闭卡片(设置为已完成)。下一个卡片我预期手工调用/after-skill即可，实际上claude code足够聪明，自己就自动调用这个skill了：

卡片 47：Pipeline 诊断完成后自动写入 Case 文件

1	/goal 实现卡片 baidu-sys-nccl-sys-skills-47

这个卡片的实现涉及跨包集成，关键改动：

导出 claude.BuildPrompt：原来 buildPrompt 是小写未导出函数，Pipeline 需要调用它获取 system/user prompt 写入 Case
PipelineConfig.CasesDir：新增配置字段，为空时不写入 Case 文件，向后兼容
Pipeline.Run defer 写入：在 defer 块中调用 writePipelineCase，覆盖成功和失败两种路径；写入失败仅 golog.Warn，不阻塞主流程
修复 extractSections：改为按已知 section 标题（System Prompt、User Prompt 等）定位内容边界，正确处理内容中含 ## 子标题的情况
3 个新测试：成功路径写入、失败路径写入、CasesDir 为空时不写入

/goal 的核心价值

没有 /goal	有 /goal
需要手动告诉 AI 做什么、验收标准是什么	AI 自动查询卡片描述，理解需求和验收标准
容易遗漏验收标准	逐条对照验收标准实现
实现完不知道是否满足要求	自动运行测试验证
做完卡片忘了关	配合 /after-goal 自动关闭

第三阶段：/after-goal — 提交合入关闭卡片

04-第三阶段：after-goal — 提交合入关闭卡片

从手动操作到 Skill 化

卡片 46 完成后，我手动执行了提交、推送、打分、合入、更新卡片、关闭卡片的全部步骤。这个过程涉及三个 CLI 工具的配合：

1	git (提交/推送) → icode-cli (打分/合入) → icafe-cli (更新卡片/关闭卡片)

问题是：每次都要查命令参数、记 CR 编号、拼 HTML 描述，容易出错。于是我把这套流程固化成了 after-goal Skill。

卡片 47 使用 /after-goal

卡片 47 实现完成后，直接调用：

1	/after-goal 卡片 baidu-sys-nccl-sys-skills-47

Claude Code 按以下步骤自动执行。实际你看下面的截图，我并没有主动调用这个skill,是claude code完成代码后自动调用的，太智能了：

Step 1: 提交代码

1
2
3

git add diag/cases/case.go diag/llm/claude/claude.go ...
git commit -m "baidu-sys-nccl-sys-skills-47 Pipeline 诊断完成后自动写入 Case 文件
..."

关键：commit message 以卡片 ID 开头，iCode 要求绑卡。

Step 2: 推送 Gerrit

1	git push origin HEAD:refs/for/master

iCode 禁止直接 push master，必须走 refs/for/。输出中包含 CR 编号。

Step 3: 打分 + 合入

1
2
3

icode-cli api get_review_info -n 120869646 -o table  # 确认可合入
icode-cli api set_review_score -r baidu/sys-nccl/sys-skills -n 120869646 -s 2  # 打分
icode-cli api submit_review -r baidu/sys-nccl/sys-skills -n 120869646  # 合入

这里有个经验：之前卡片 46 时我尝试用 playwright-cli 打开 iCafe 网页操作，非常笨重（弹窗多、元素难定位、登录态问题）。换成 icode-cli 后一条命令搞定打分和合入，效率提升巨大。

Step 4: 更新卡片描述

1 2	icafe-cli card update --space baidu-sys-nccl-sys-skills --sequence 47 \ --detail "<原有描述><h3>实现总结</h3><ul>...</ul>"

注意 --detail 会覆盖整个描述，必须保留原有内容再追加。实现总结包含：核心改动、测试覆盖、验证结果、Commit 和 CR 链接。

Step 5: 关闭卡片

1 2	icafe-cli card next-statuses --space ... --sequence 47 # 查可用状态 icafe-cli card update --space ... --sequence 47 --status 已完成 # 关闭

状态名不是随便写的，不同空间可能不同（"已完成" vs "Done"），必须先查 next-statuses。

/after-goal 的核心价值

手动操作	/after-goal
5 步操作分别手动执行	一条命令自动串行
容易忘关卡片、忘更新描述	强制更新描述 + 关闭卡片
commit message 可能忘绑卡	强制以卡片 ID 开头
playwright-cli 操作网页笨重	icode-cli + icafe-cli 命令行高效

经验总结

05-经验总结

1. PRD 先行，避免返工

AI 直接写代码容易偏离需求。先用 /prd 生成结构化 PRD，确认范围和验收标准后再拆卡片实现，能大幅减少返工。

2. 卡片粒度要适中

本次拆出的卡片 46（纯数据模型 + 读写库）和卡片 47（Pipeline 集成）各自独立、验收标准清晰，AI 能一次实现到位。如果卡片太大（比如把 46 + 47 合成一个），实现过程中容易丢失焦点。

3. 依赖关系决定实现顺序

卡片 47 依赖卡片 46 的 cases 包。按依赖顺序实现，每个卡片完成后再做下一个，避免同时改多个包产生冲突。

4. CLI 工具优于浏览器操作

操作	浏览器 (playwright-cli)	CLI
CR 打分	打开页面 → 找元素 → 点击 → 登录态问题	`icode-cli api set_review_score -s 2`
卡片状态	同上	`icafe-cli card update --status 已完成`
可靠性	页面结构变化会 break	命令行接口稳定

结论：凡是能用 CLI 完成的操作，不要用浏览器。

5. Skill 是流程知识的载体

after-goal Skill 把「提交代码 → 推送 Gerrit → 打分合入 → 更新卡片 → 关闭卡片」这套需要记住的操作流程固化成了可复用的 Skill。核心要素：

触发条件：/after-goal 或说"提交代码"、"打分合入"、"关闭卡片"
步骤定义：5 步串行流程，每步有具体命令和参数
错误处理：常见问题的处理方式（push 被拒、状态名不对等）
关键规则：commit message 绑卡、--detail 覆盖问题、先查 next-statuses

写 Skill 的过程本身就是梳理流程、沉淀知识的过程。

6. 踩坑即修正，不要留到后面

卡片 46 中 extractSections 按 \n## 分割的方案在简单场景下工作，但卡片 47 的 UserPrompt 包含 ## 子标题时解析失败。发现后立即修复（改为按已知标题定位），而不是"先这样后面再说"。早期修正成本最低。

三阶段协作模式

06-三阶段协作模式

┌─────────────┐     ┌──────────────┐     ┌───────────────┐
│   /prd      │     │   /goal      │     │  /after-goal  │
│             │     │              │     │               │
│ 需求 → PRD  │────▶│ 卡片 → 代码  │────▶│ 代码 → 合入   │
│ PRD → 卡片  │     │ 代码 → 测试  │     │ 合入 → 关卡   │
└─────────────┘     └──────────────┘     └───────────────┘
      ↑                    ↑                     ↑
      │                    │                     │
  人类定方向           AI 执行实现          AI 执行收尾
  AI 辅助拆解         人类验收结果          流程自动闭环

三个阶段各有侧重：

/prd：人类主导方向，AI 辅助结构化输出
/goal：AI 主导实现，人类验收结果
/after-goal：AI 全自动执行，流程自动闭环

这套模式不仅适用于本次「诊断案例记录」功能，任何需要从需求到上线的开发任务都可以复用。只需三个命令，就能走完从需求拆解到代码合入的全流程。

autoresearch

07-autoresearch

先前我也介绍了autoresearch全自动开发的方式和流程，整个流程和这个类似，不过autoresearch在开发过程中采用了多智能体review和开发的方式，通过5个维度对代码进行打分，给予开发者更灵活的配置方法，但是开发速度也远远大于/goal的方式，token的费用也远远大于/goal的方式。
所以如果想实现一个轻量级的全自动开发流程，本文介绍的/PRD → /Goal → /After-Goal 是一个不错的选择。