Kanban:用看板编排 AI Agent 项目

"You don't write the code anymore. You move the cards."
你不写代码了。你移动卡片。

——leodavinci1, kanbots 作者

Skills 封装能力。Spec 写合约。Ralph Loop 循环到对。gstack 角色覆盖。Goal Workflow 流水线串联。autoresearch 全自动闭环。这些方法论解决的都是"一个 Agent 怎么做事"。

真实场景从来不是一个 Agent。是多个 Agent 同时跑在不同的 worktree 里,多张卡片分布在多块板子上,你不盯就没人在盯。

Kanban 管的就是这个局面。管 Agent。

阅读全文

Harness Engineering:AI Agent 的工程实践

"The decisive result came not from the model alone, but from the harness around it."
决定成败的不仅是模型本身,更是其配套的外围系统。

——Anthropic Harness Engineering Team

Skill 封装能力。Spec 写规格。Ralph Loop 自己跑到对。gstack 用角色覆盖质量。Goal Workflow 串成七步流水线。autoresearch 全自动从 Issue 到合入。

这些方法论都在 Claude Code 之上运行。但 Claude Code 自己怎么造出来的?它调工具、读文件、写代码、执行 Bash——每一步都可能出错、可能越权、可能陷入死循环。谁在管这些?

Harness Engineering 回答的就是这个问题。不是"怎么用 Agent",是"怎么造 Agent"。本章拆开 Claude Code 的引擎盖,看它的 hooks、settings.json、权限模型、沙箱、可观测性怎么拼在一起,把一个大语言模型变成可安全交付的产品。

阅读全文

方法论对比与融合

"小孩子才做选择题,成年人当然全都要"

——网络梗

前八章覆盖了七条路线。

Pocock Skills 拆能力。OpenSpec 写规格。Ralph Loop 自己循环到对。gstack 用角色覆盖质量。superpowers 让 Agent 替你选工具。autoresearch 一口气自动到合入。Goal Workflow 串成七步,每步等你说过。

每条路都能走通。真实项目从来不只走一条。Ralph Loop 做实现,谁来审查?gstack 走流程,需求从哪来?autoresearch 全自动跑,Issue 谁拆的?

贪吃蛇案例已经验证了这一点。第 5 章 gstack 走了七个 Sprint 阶段,手工推着走,约两小时。第 6 章 superpowers 后台监听关键词,你答了五个设计问题,约五分钟。第 7 章 autoresearch 你写了一个 Issue,约三分钟,然后等结果。第 8 章 Goal Workflow 每步确认一下,从 PRD 到上线,约八分钟。

同一个贪吃蛇,同一个产出,四种交互模式。

本章把七条路摊开,看它们怎么拼。

阅读全文

Goal Workflow:目标驱动的研发闭环

"你只需描述功能想法,剩下的交给工作流。"

——smallnest, Goal Workflow 作者, 2026 年 5月

三条路。gstack 覆盖从需求到交付,但你得手动驱动每个阶段。superpowers 覆盖从设计到代码,但止步于开发分支。autoresearch 覆盖从 Issue 到合入,但它假设 Issue 已经存在。每条路都只解了一段。

实际项目不是这样的。实际项目从一句"我想做一个东西"开始。然后你要搞清楚它是什么、设计它怎么做、拆成小块、逐块实现、审查代码、记录决策、最后合入上线。七个动作,缺一个就是断点。每个断点都是你手动接续的地方。

Goal Workflow 做的事就是把这些断点接上。不是做一个更强的 /goal 命令。是做一条流水线——七个斜杠命令,首尾相连,从 PRD 到上线。

阅读全文

autoresearch:全自动化软件开发

「你只需负责喝茶和睡觉。一觉醒来,Features 全自动高质量的实现了。」

——smallnest, autoresearch 作者, 2026 年

gstack 是人驱动流程,二十三个角色在七个 Sprint 阶段中协作。superpowers 是 Agent 驱动流程,十四个 Skill 自动触发,子 Agent 分工实现。两条路,一个共同点:人类仍然在循环中。gstack 需要你在每个阶段运行命令。superpowers 需要你在设计批准时确认方案。

autoresearch 把这个共同点也推倒了。

它的目标一句话就能说清楚:从 Issue 到合入,全程不需要人。你写好 Issue,Agent 自己实现、自己审查、自己修复、自己提 PR、自己合入、自己关 Issue。你喝茶。你睡觉。醒来看到一排绿色的 merged。

Karpathy 的 autoresearch 思想在软件工程领域落地了——82K Stars 的 ML 研究自动化项目,被 smallnest 适配成了通用的全自动开发工具。

阅读全文

superpowers 技能框架:Agent 能力增强

"The agent checks for relevant skills before any task. Mandatory workflows, not suggestions."
Agent 在执行任何任务之前,先检查自己有没有对应的技能。这些是强制工作流,不是建议。

——Jesse Vincent, Superpowers 作者, 2025 年

gstack 用二十三个角色和七个 Sprint 阶段构建流程驱动的虚拟工程团队。CEO 审方向,工程经理锁架构,QA 测功能,安全官审漏洞——每个角色在固定阶段做固定的事。

superpowers 走相反的路。

superpowers 不定义任何角色。不强制任何 Sprint 阶段。它只做一件事:给你十四个 Skill,让 Agent 自己在合适的时机调用合适的那个。不靠流程锁住质量——靠每个 Skill 足够好用,Agent 自己愿意用它们。

201K+ Stars。当你不信任流程、只信任工具时,AI 软件工程能做多大——这个数字就是答案。

阅读全文

gstack 方法论:虚拟工程团队

"I basically operate as an engineering manager for a fleet of temporary models."
我本质上是一个工程经理,管理一支临时工模型大军。

——Garry Tan, Y Combinator 总裁 & CEO, 2026 年

Skill 是能力单元——一个 Markdown 文件定义一种行为。Spec 是合约,定义"做成什么样才算对"。Ralph Loop 是执行引擎,"做不到就继续做"。三者构成闭环:Skill 提供方法,Spec 提供标准,Ralph Loop 提供执行力。

但它们都隐含了同一个假设:你只有一个 Agent。

把这个假设推倒。如果你可以同时拥有二十三个 Agent,每个被赋予一个不同的专家角色——有人负责产品思考,有人负责架构设计,有人负责代码审查,有人负责质量测试,有人负责安全审计,有人负责发布部署——并且它们按照一个严格的 Sprint 流程协作。会发生什么?

gstack 回答这个问题。它是一个虚拟工程团队的操作系统。

阅读全文

Ralph Loop:自主循环开发

"Ralph is a Bash loop."
——Geoffrey Huntley, 2025 年

这句话是对 Ralph Wiggum 技术最精确的定义。不是架构图,不是论文,不是 200 页的设计文档。就是一个 while 循环。把同一个 prompt 反复喂给 AI,让它看到自己上一轮的产出,然后改进。再改进。直到成功。

第 3 章定义了 Spec——你和 AI 之间的合约,写清楚"做成什么样才算对"。合约签完了,履约过程仍然充满不确定性。Agent 第一次实现可能偏离规格,第二次修好一个问题却引入另一个,第三次陷入改动 A 破坏 B、修复 B 破坏 A 的死循环。

Ralph Loop 应对的就是这个。如果 Spec 管"做到什么标准",Ralph Loop 管"做不到就继续做"。它不是一个文档,不是一个 Skill——它是一个自主循环控制结构,把 AI Agent 从一次性助手变成了不知疲倦的初级工程师。

本章三条线索。第一,Ralph Loop 的起源——一个《辛普森一家》的梗如何变成了 AI 工程中的核心模式。第二,Anthropic 官方的 ralph-wiggum 插件——用 Stop Hook 实现会话内自指涉循环,目前最优雅的实现。第三,Ralph 生态中的其他实现。

自指涉(self-referential):AI 的产出变成自己的输入。不是把上一轮的输出文本喂给下一轮——而是 AI 在文件系统里读到自己刚写的代码,发现 bug,自己修。输入始终是同一个 prompt,但 AI 每次看到的文件系统都不一样,因为它上一轮已经改过一遍了。

阅读全文

规格驱动开发:人类与AI的合约

"The specification is the source of truth, and code derives from it — not the other way around."
规格是真理的来源,代码派生自规格——而不是反过来。

——Deepak Babu Piskala, 《Spec-Driven Development: From Code to Contract in the Age of AI Coding Assistants》, 2026 年

Skill 是 AI Agent 的能力单元:一个 Markdown 文件定义一种行为,小而可组合,可复用可迭代。但多个 Skill 组合在一起时,它们之间的"合约"是什么?谁来保证 /tdd 写的测试和 /grill-with-docs 对齐的需求是同一件事?

这就是规格驱动开发(Spec-Driven Development,SDD)要解决的问题。如果 Skill 是原子能力,那么 Spec 就是这些能力之间的接口协议。它不定义"怎么做",而是定义"做成什么样才算对"。

三条线索:SDD 的思想史(根源比 AI 编码工具早得多,但 AI 让它从学院派理想变成了工程必需品);三个代表性工具的逐层分析(OpenSpec、GitHub Spec-Kit、AWS Kiro);跨工具的通用原则。

三个线索汇聚到一句:规格不是在浪费时间写文档——规格是你和 AI 之间最有效率的通信协议。

阅读全文

Matt Pocock 的 Skills 系统:真正的工程,不是氛围编程

本文深入分析 Matt Pocock 的 Skills 系统——目前社区中设计最精良、哲学最自洽的 AI Agent 能力单元框架之一。它不追求最大最全,但它对「什么是一个好的 Skill」这个问题的思考深度,远超同类项目。从 Prompt-Driven 到 Skill-Driven——Prompt 消失在对话历史里,Skill 留在工具链里。

阅读全文