番外. AI Agent 与 Harness：Anthropic 和 LangChain 的 Harness Engineering

Sun, 29 Mar 2026 15:00:00 +0800

引言

聊 harness engineering，资料并不少，真正难的是不同文章经常不在同一层说话。

Anthropic 和 LangChain 这两篇很适合放在一起看：前者更像在谈长任务架构，后者更像在谈运行时调优。

如果前两篇《01. AI Agent 与 Harness：概念梳理》和《02. AI Agent 与 Harness：从 Prompt 到 Harness》解决的是概念和背景，那么这一篇要解决的是三件事：

如果你更关心落地阶段的验证闭环，可以接着读《03. AI Agent 与 Harness：V2 Harness 的验证设计》。

因为它们都把一个过去经常被模糊处理的问题说透了：

模型能力强，不等于系统就稳定。

过去很多讨论会把注意力放在：

但这两篇文章真正强调的是：

也就是说，它们讨论的重点不是“模型会不会”，而是“系统能不能稳定做完”。

文章原文：

Anthropic 那篇最重要的一个信号是：
他们说的 harness，不是几个 prompt，不是一份 AGENTS.md，也不是若干个 tool 描述。