Anthropic 官方插件:AI Agent 的领域知识插件

"The decisive result came not from the model alone, but from the harness around it."
决定成败的不仅是模型本身,更是其配套的外围系统。

——Anthropic Harness Engineering Team

第 2 章讲了 Skills 系统——Matt Pocock 的工程哲学:一个 Markdown 文件定义一种行为,小而可组合。第 6 章讲了 superpowers——社区级 Skills 库,十四个 Skill 覆盖十四个场景。

Anthropic 自己为 Claude Code 开发了 13 个官方插件。截至 2026 年 5 月,全部放在 Claude Code 仓库的 plugins/ 目录下。和社区 Skills 不同,这些插件是 Anthropic 工程师为 Claude Code 构建的第一方工具——通过 /plugin 安装,深度集成到 hooks、agents、skills 三层基础设施中。

安装。 所有 13 个插件通过同一命令安装:

1
/plugin install code-review

/plugin install <name> 从 Anthropic 官方源拉取插件,注册斜杠命令、hooks 和 Agent。/plugin marketplace add 可添加第三方源。安装后插件在 ~/.claude/plugins/ 下,可手动编辑配置。

阅读全文

Harness Engineering:AI Agent 的工程实践

"The decisive result came not from the model alone, but from the harness around it."
决定成败的不仅是模型本身,更是其配套的外围系统。

——Anthropic Harness Engineering Team

Skill 封装能力。Spec 写规格。Ralph Loop 自己跑到对。gstack 用角色覆盖质量。Goal Workflow 串成七步流水线。autoresearch 全自动从 Issue 到合入。

这些方法论都在 Claude Code 之上运行。但 Claude Code 自己怎么造出来的?它调工具、读文件、写代码、执行 Bash——每一步都可能出错、可能越权、可能陷入死循环。谁在管这些?

Harness Engineering 回答的就是这个问题。不是"怎么用 Agent",是"怎么造 Agent"。本章拆开 Claude Code 的引擎盖,看它的 hooks、settings.json、权限模型、沙箱、可观测性怎么拼在一起,把一个大语言模型变成可安全交付的产品。

阅读全文

Ralph Loop:自主循环开发

"Ralph is a Bash loop."
——Geoffrey Huntley, 2025 年

这句话是对 Ralph Wiggum 技术最精确的定义。不是架构图,不是论文,不是 200 页的设计文档。就是一个 while 循环。把同一个 prompt 反复喂给 AI,让它看到自己上一轮的产出,然后改进。再改进。直到成功。

第 3 章定义了 Spec——你和 AI 之间的合约,写清楚"做成什么样才算对"。合约签完了,履约过程仍然充满不确定性。Agent 第一次实现可能偏离规格,第二次修好一个问题却引入另一个,第三次陷入改动 A 破坏 B、修复 B 破坏 A 的死循环。

Ralph Loop 应对的就是这个。如果 Spec 管"做到什么标准",Ralph Loop 管"做不到就继续做"。它不是一个文档,不是一个 Skill——它是一个自主循环控制结构,把 AI Agent 从一次性助手变成了不知疲倦的初级工程师。

本章三条线索。第一,Ralph Loop 的起源——一个《辛普森一家》的梗如何变成了 AI 工程中的核心模式。第二,Anthropic 官方的 ralph-wiggum 插件——用 Stop Hook 实现会话内自指涉循环,目前最优雅的实现。第三,Ralph 生态中的其他实现。

自指涉(self-referential):AI 的产出变成自己的输入。不是把上一轮的输出文本喂给下一轮——而是 AI 在文件系统里读到自己刚写的代码,发现 bug,自己修。输入始终是同一个 prompt,但 AI 每次看到的文件系统都不一样,因为它上一轮已经改过一遍了。

阅读全文

Matt Pocock 的 Skills 系统:真正的工程,不是氛围编程

本文深入分析 Matt Pocock 的 Skills 系统——目前社区中设计最精良、哲学最自洽的 AI Agent 能力单元框架之一。它不追求最大最全,但它对「什么是一个好的 Skill」这个问题的思考深度,远超同类项目。从 Prompt-Driven 到 Skill-Driven——Prompt 消失在对话历史里,Skill 留在工具链里。

阅读全文