2026年06月28日

AI

by smallnest

GSD Core：对抗上下文腐化的阶段循环引擎

"Claude Code is powerful. GSD Core makes it reliable."
Claude Code 很强大。GSD Core 让它变得可靠。

——open-gsd/gsd-core README

第 12 章给了 Loop Engineering 一个很大的愿景：你不再提示 Agent，而是设计提示 Agent 的循环。但那一章停在原理层，讲的是五个原语加一个状态记忆。把这些原语落成一套能直接安装、有明确文件结构、带 67 个命令的工程系统，是另一回事。

GSD Core 就是这样一套系统。它不发明新的 Agent，也不取代 Claude Code，而是套在你已有的运行时上面，把讨论、规划、执行、验证、交付这五步，固化成每个里程碑都要重复一遍的流水线。它想回答的不是"Agent 能不能写代码"，这个早就不是问题了，而是一个更隐蔽的问题：为什么 Agent 在小任务上表现惊艳，一接手大项目就开始胡言乱语？

这个问题有名字，叫上下文腐化（Context Rot）。本章讲 GSD Core 怎么把对抗上下文腐化当成第一性原则，用阶段循环、子智能体、持久化工件这三样东西，把一个容易漂移的编码 Agent 变成靠得住的工程伙伴。

阅读全文

2026年06月28日

AI

by smallnest

Loop Engineering：从提示 Agent 到设计循环

"You shouldn't be prompting coding agents anymore. You should be designing loops that prompt your agents."
你不应该再提示编码 Agent 了。你应该设计循环来提示你的 Agent。

——Peter Steinberger, 2026 年 6 月 7 日

第 10 章搭了 Agent 的运行环境——hooks、权限、沙箱、配置继承。第 11 章用 Kanban 管多个 Agent 的并行编排。但有一个更根本的问题还没回答：每次都是你在提示 Agent。你打字，它回话，你再打字。你不在，它就不动。

2026 年 6 月，两条推文把这个矛盾推到了台前。Peter Steinberger（OpenClaw 作者）的那句话在 48 小时内获得 220 万次浏览。几天后，Boris Cherny（Anthropic Claude Code 负责人）在 WorkOS 的 Acquired Unplugged 活动上说了几乎同样的话："I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops."

全网炸了。但没人说得清"loop"到底是什么。有人说是 Ralph Loop 的翻版，有人说是"戴了顶帽子的 cron job"，有人说"prompt engineering 已死"。一周之内，Reddit、Hacker News、X 上的讨论翻了几十页，最诚实的回答是 Matthew Berman 那句："Nobody knows but him and Boris."

Addy Osmani 随即发表了长文"Loop Engineering"，给了这个概念第一个完整的拆解。本章基于 Osmani 的框架，结合 Boris Cherny 的实践、Geoffrey Huntley 的 Ralph Loop 思想、以及 AlphaSignal 的四条件测试，回答三个问题：Loop Engineering 是什么？它和前十一章的方法论什么关系？你真的需要它吗？

阅读全文

2026年06月28日

AI

by smallnest

Kanban：用看板编排 AI Agent 项目

"You don't write the code anymore. You move the cards."
你不写代码了。你移动卡片。

——leodavinci1, kanbots 作者

Skills 封装能力。Spec 写合约。Ralph Loop 循环到对。gstack 角色覆盖。Goal Workflow 流水线串联。autoresearch 全自动闭环。这些方法论解决的都是"一个 Agent 怎么做事"。

真实场景从来不是一个 Agent。是多个 Agent 同时跑在不同的 worktree 里，多张卡片分布在多块板子上，你不盯就没人在盯。

Kanban 管的就是这个局面。管 Agent。

阅读全文

2026年06月28日

AI

by smallnest

Harness Engineering：AI Agent 的工程实践

"The decisive result came not from the model alone, but from the harness around it."
决定成败的不仅是模型本身，更是其配套的外围系统。

——Anthropic Harness Engineering Team

Skill 封装能力。Spec 写规格。Ralph Loop 自己跑到对。gstack 用角色覆盖质量。Goal Workflow 串成七步流水线。autoresearch 全自动从 Issue 到合入。

这些方法论都在 Claude Code 之上运行。但 Claude Code 自己怎么造出来的？它调工具、读文件、写代码、执行 Bash——每一步都可能出错、可能越权、可能陷入死循环。谁在管这些？

Harness Engineering 回答的就是这个问题。不是"怎么用 Agent"，是"怎么造 Agent"。本章拆开 Claude Code 的引擎盖，看它的 hooks、settings.json、权限模型、沙箱、可观测性怎么拼在一起，把一个大语言模型变成可安全交付的产品。

阅读全文

2026年06月28日

AI

by smallnest

方法论对比与融合

"小孩子才做选择题，成年人当然全都要"

——网络梗

前八章覆盖了七条路线。

Pocock Skills 拆能力。OpenSpec 写规格。Ralph Loop 自己循环到对。gstack 用角色覆盖质量。superpowers 让 Agent 替你选工具。autoresearch 一口气自动到合入。Goal Workflow 串成七步，每步等你说过。

每条路都能走通。真实项目从来不只走一条。Ralph Loop 做实现，谁来审查？gstack 走流程，需求从哪来？autoresearch 全自动跑，Issue 谁拆的？

贪吃蛇案例已经验证了这一点。第 5 章 gstack 走了七个 Sprint 阶段，手工推着走，约两小时。第 6 章 superpowers 后台监听关键词，你答了五个设计问题，约五分钟。第 7 章 autoresearch 你写了一个 Issue，约三分钟，然后等结果。第 8 章 Goal Workflow 每步确认一下，从 PRD 到上线，约八分钟。

同一个贪吃蛇，同一个产出，四种交互模式。

本章把七条路摊开，看它们怎么拼。

阅读全文

2026年06月28日

AI

by smallnest

Goal Workflow：目标驱动的研发闭环

"你只需描述功能想法，剩下的交给工作流。"

——smallnest, Goal Workflow 作者, 2026 年 5月

三条路。gstack 覆盖从需求到交付，但你得手动驱动每个阶段。superpowers 覆盖从设计到代码，但止步于开发分支。autoresearch 覆盖从 Issue 到合入，但它假设 Issue 已经存在。每条路都只解了一段。

实际项目不是这样的。实际项目从一句"我想做一个东西"开始。然后你要搞清楚它是什么、设计它怎么做、拆成小块、逐块实现、审查代码、记录决策、最后合入上线。七个动作，缺一个就是断点。每个断点都是你手动接续的地方。

Goal Workflow 做的事就是把这些断点接上。不是做一个更强的 /goal 命令。是做一条流水线——七个斜杠命令，首尾相连，从 PRD 到上线。

阅读全文

2026年06月28日

AI

by smallnest

autoresearch：全自动化软件开发

「你只需负责喝茶和睡觉。一觉醒来，Features 全自动高质量的实现了。」

——smallnest, autoresearch 作者, 2026 年

gstack 是人驱动流程，二十三个角色在七个 Sprint 阶段中协作。superpowers 是 Agent 驱动流程，十四个 Skill 自动触发，子 Agent 分工实现。两条路，一个共同点：人类仍然在循环中。gstack 需要你在每个阶段运行命令。superpowers 需要你在设计批准时确认方案。

autoresearch 把这个共同点也推倒了。

它的目标一句话就能说清楚：从 Issue 到合入，全程不需要人。你写好 Issue，Agent 自己实现、自己审查、自己修复、自己提 PR、自己合入、自己关 Issue。你喝茶。你睡觉。醒来看到一排绿色的 merged。

Karpathy 的 autoresearch 思想在软件工程领域落地了——82K Stars 的 ML 研究自动化项目，被 smallnest 适配成了通用的全自动开发工具。

阅读全文

2026年06月28日

AI

by smallnest

superpowers 技能框架：Agent 能力增强

"The agent checks for relevant skills before any task. Mandatory workflows, not suggestions."
Agent 在执行任何任务之前，先检查自己有没有对应的技能。这些是强制工作流，不是建议。

——Jesse Vincent, Superpowers 作者, 2025 年

gstack 用二十三个角色和七个 Sprint 阶段构建流程驱动的虚拟工程团队。CEO 审方向，工程经理锁架构，QA 测功能，安全官审漏洞——每个角色在固定阶段做固定的事。

superpowers 走相反的路。

superpowers 不定义任何角色。不强制任何 Sprint 阶段。它只做一件事：给你十四个 Skill，让 Agent 自己在合适的时机调用合适的那个。不靠流程锁住质量——靠每个 Skill 足够好用，Agent 自己愿意用它们。

201K+ Stars。当你不信任流程、只信任工具时，AI 软件工程能做多大——这个数字就是答案。

阅读全文

2026年06月28日

AI

by smallnest

gstack 方法论：虚拟工程团队

"I basically operate as an engineering manager for a fleet of temporary models."
我本质上是一个工程经理，管理一支临时工模型大军。

——Garry Tan, Y Combinator 总裁 & CEO, 2026 年

Skill 是能力单元——一个 Markdown 文件定义一种行为。Spec 是合约，定义"做成什么样才算对"。Ralph Loop 是执行引擎，"做不到就继续做"。三者构成闭环：Skill 提供方法，Spec 提供标准，Ralph Loop 提供执行力。

但它们都隐含了同一个假设：你只有一个 Agent。

把这个假设推倒。如果你可以同时拥有二十三个 Agent，每个被赋予一个不同的专家角色——有人负责产品思考，有人负责架构设计，有人负责代码审查，有人负责质量测试，有人负责安全审计，有人负责发布部署——并且它们按照一个严格的 Sprint 流程协作。会发生什么？

gstack 回答这个问题。它是一个虚拟工程团队的操作系统。

阅读全文

2026年06月28日

AI

by smallnest

Ralph Loop：自主循环开发

"Ralph is a Bash loop."
——Geoffrey Huntley, 2025 年

这句话是对 Ralph Wiggum 技术最精确的定义。不是架构图，不是论文，不是 200 页的设计文档。就是一个 while 循环。把同一个 prompt 反复喂给 AI，让它看到自己上一轮的产出，然后改进。再改进。直到成功。

第 3 章定义了 Spec——你和 AI 之间的合约，写清楚"做成什么样才算对"。合约签完了，履约过程仍然充满不确定性。Agent 第一次实现可能偏离规格，第二次修好一个问题却引入另一个，第三次陷入改动 A 破坏 B、修复 B 破坏 A 的死循环。

Ralph Loop 应对的就是这个。如果 Spec 管"做到什么标准"，Ralph Loop 管"做不到就继续做"。它不是一个文档，不是一个 Skill——它是一个自主循环控制结构，把 AI Agent 从一次性助手变成了不知疲倦的初级工程师。

本章三条线索。第一，Ralph Loop 的起源——一个《辛普森一家》的梗如何变成了 AI 工程中的核心模式。第二，Anthropic 官方的 ralph-wiggum 插件——用 Stop Hook 实现会话内自指涉循环，目前最优雅的实现。第三，Ralph 生态中的其他实现。

自指涉（self-referential）：AI 的产出变成自己的输入。不是把上一轮的输出文本喂给下一轮——而是 AI 在文件系统里读到自己刚写的代码，发现 bug，自己修。输入始终是同一个 prompt，但 AI 每次看到的文件系统都不一样，因为它上一轮已经改过一遍了。

阅读全文