AI Agent on 星澜

06. AI Agent 与 Harness：Harness 是终局还是中间态？

Wed, 01 Apr 2026 09:00:00 +0800

引言

Anthropic 和 Codex 的分歧，最近算是公开了。

同样都在做 coding agent，但对 harness 的判断，两边已经走出了明显不同的方向。一边是 Anthropic 的工程博客，系统展示了他们怎么把 harness 做得更强、更厚。另一边是 Codex 开源负责人 Michael Bolin 在一场访谈里给出的信号——几乎是反着来的。一个在继续加厚，一个在说别做那么厚。

这把一个本来没什么争议的问题顶到了台面上：harness 到底是终局，还是只是中间态？

Anthropic 在做什么

为了让 Claude Code 能稳定跑完长任务、构建完整应用，Anthropic 往 harness 里加了不少重的结构：

planner：把一句话需求展开成完整规格
generator：负责真正去实现
evaluator：模拟真实用户去跑页面、接口、数据库状态
context reset：上下文快脏掉的时候直接清空，重新起一个新 agent，通过结构化交接文件把状态接过去

这套路线的核心判断是：模型本身还不够稳，所以得靠更强的外部编排来兜住长任务里的跑偏风险。复杂任务之所以能落地，靠的不是单次生成能力，而是整套控制结构够不够强。

说白了就是：模型做事，harness 保证别失控。

Codex 在说什么

Michael Bolin 在访谈里给出的方向几乎是反过来的。他说他们理想中的 harness 应该尽可能小、尽可能轻。

不是说 harness 不重要，而是：不要把太多决策硬编码进外部框架，不要疯狂堆专用工具，不要让模型每走一步都被人类写好的规则牵着走。

Codex 的思路更像是给模型一个真实的运行环境——终端、沙盒、必要的上下文连接能力——但探索路径、调用方式、执行策略，尽量让模型自己决定。

打个比方：脚手架可以有，但别把它做成一栋楼。因为模型早晚会涨到能自己处理更多东西。

两边真正的分歧在哪

表面看是 harness 该做厚还是做薄，但其实两边都没有否认 harness 的价值。他们真正分歧的，是对模型能力曲线的判断不一样。

Anthropic 在回答：模型还不够稳的时候，怎样让复杂任务真的跑起来
Codex 在回答：模型越来越强之后，哪些外部结构还值得保留

这不是技术细节的分歧，而是两个不同时间假设下的工程选择。

如果模型的大幅提升还很远，Anthropic 那条路就是现阶段最务实的选择。如果模型跃迁来得很快，Codex 那条路是在提醒你：别把过渡期的脚手架做成未来的长期负担。

底线

Bolin 也没有说 harness 会彻底消失。他保留了一个底线：环境和安全不退场。

番外. AI Agent 与 Harness：Anthropic 和 LangChain 的 Harness Engineering

Sun, 29 Mar 2026 15:00:00 +0800

引言

聊 harness engineering，资料并不少，真正难的是不同文章经常不在同一层说话。

Anthropic 和 LangChain 这两篇很适合放在一起看：前者更像在谈长任务架构，后者更像在谈运行时调优。

如果前两篇《01. AI Agent 与 Harness：概念梳理》和《02. AI Agent 与 Harness：从 Prompt 到 Harness》解决的是概念和背景，那么这一篇要解决的是三件事：

Anthropic 和 LangChain 这两篇文章各自在强调什么
它们为什么都把 harness 看得比 prompt 更重要
它们的视角有什么共同点，又有什么区别

如果你更关心落地阶段的验证闭环，可以接着读《03. AI Agent 与 Harness：V2 Harness 的验证设计》。

为什么这两篇文章值得单独拿出来看

因为它们都把一个过去经常被模糊处理的问题说透了：

模型能力强，不等于系统就稳定。

过去很多讨论会把注意力放在：

模型版本
提示词技巧
上下文长度
是否支持工具调用

但这两篇文章真正强调的是：

工具怎么组织
上下文怎么管理
失败怎么被发现
系统怎么返工
长任务怎么防止熵增

也就是说，它们讨论的重点不是“模型会不会”，而是“系统能不能稳定做完”。

Anthropic 那篇，到底在讲什么

文章原文：

Effective harnesses for long-running agents

1. 它说的 harness 很重

Anthropic 那篇最重要的一个信号是：
他们说的 harness，不是几个 prompt，不是一份 AGENTS.md，也不是若干个 tool 描述。

05. AI Agent 与 Harness：Agent Harness、Graph 与退款 Agent

Sun, 29 Mar 2026 14:00:00 +0800

引言

上一篇讲的是第一类场景：用现成 agent 产品时，团队怎么把自己的 harness 搭好。

这篇讲第二类：如果是自己开发退款 agent、审批 agent、客服分诊 agent，agent harness 到底长什么样？

这是《01. AI Agent 与 Harness：概念梳理》里提到的第二类场景——不是在现成 agent 产品外面加一层团队规范，而是自己从头搭一套业务 agent 系统。

对退款、审批、客服分诊、工单流转这类系统来说，第一步通常不是先打磨 prompt，而是先把流程图画出来。图一旦清楚，第一版系统骨架往往也就跟着出来了。

为什么先画流程图，再谈 agent

这当然不是说：

流程图 = 代码

而是说，对于退款、审批、分诊、风控这类业务 agent，你一旦能把下面几件事画清楚，第一版系统骨架其实就已经出来了：

有哪些节点
节点之间怎么流转
哪些节点必须确定性执行
哪些节点可以交给模型判断
哪些地方要加人工接管
哪些地方要加验证和返工

很多团队一开始觉得自己是在“做 AI agent”，后来真正落地时会发现，第一步其实更像：

画流程图
画状态流转
画工具调用图
画失败回退路径

这些图一旦清楚了，agent harness 的大部分骨架也就跟着清楚了。

能画出流程图，不代表已经把 agent 写完了；但通常已经走到了“能开始写 agent harness”的阶段。

Graph 在表达什么

这里说的 graph，不要只把它理解成某个具体框架的对象。
它更广义地指：

节点
边
状态
路由规则
重试和返工路径

一个业务 agent 的 graph，通常至少会包含几类节点：

LLM 节点
- 负责意图理解、信息提取、回复生成、某些开放判断
工具节点
- 查订单、查政策、调退款接口、写工单、发通知
规则节点
- 权限判断、风控判断、政策判断
验证节点
- 检查动作结果是否真的生效
人工节点
- 升级审批、转人工处理、人工兜底

这时 graph 真正表达的，不只是“业务流程长什么样”，还包括：

04. AI Agent 与 Harness：Repo Instructions、Skills 与团队工作流

Sun, 29 Mar 2026 13:00:00 +0800

引言

前面两篇篇把概念、演进背景和验证设计铺开了，从这篇开始落地。

《01. AI Agent 与 Harness：概念梳理》里提到两类场景，这篇先讲第一类：对大多数团队来说，眼前更现实的任务并不是马上造一套业务 agent 系统，而是先把 Codex、Claude Code 这类现成 agent 用稳。

这时候真正需要补的，就是团队自己的那层 harness——仓库里的这些东西：

repo instructions
skills
MCP 使用约定
验证命令
交付格式
review / CI workflow

放到一个典型的后端团队里，这件事会变得很具体：

Web 框架用 gin
数据层用 gorm
缓存用 redis
已经有链路追踪
也能通过 MCP 查日志、查 traces、查数据库

问题也会跟着收敛成一句话：

在这种团队里，怎么把默认工作方式写成 agent 也能稳定遵守的仓库规则？

团队上下文要写清楚

很多团队装了 MCP、写了几句提示词，就以为自己已经在做 harness。
但如果 agent 连“这个仓库到底怎么工作”都不知道，它其实还是进不了团队的真实语境。

所以第一步不是堆工具，而是把上下文写明白。

像一个 gin + gorm + redis 的 Go 团队，至少要把这些共识显式化：

项目目录结构
HTTP 层怎么组织
service / repository 怎么分层
gorm 查询和事务怎么写
redis key 命名、TTL 和失效策略怎么定
trace 和日志字段怎么打
什么命令算基本验证
什么结果才算 done

这些东西如果只存在于资深同事脑子里，agent 是用不稳的。

03. AI Agent 与 Harness：V2 Harness 的验证设计

Sun, 29 Mar 2026 12:00:00 +0800

引言

前面两篇把概念和演进背景铺开了，但真正落到工程里，最难的一层往往不是”怎么让 agent 开始做事”，而是”怎么确认它真的做成了”。

很多团队已经有 prompt、skill、AGENTS.md、MCP 和常用工具，agent 也确实能开始干活。
问题通常出在交付阶段：测试会漏跑，状态会漏校验，模型会以为自己完成了，系统却没有真的过关。

所以这一篇只想回答一个非常落地的问题：

验证阶段的 harness，到底应该怎么设计？

尤其是下面这个追问：

coding agent 里，我们已经会在 AGENTS.md、CLAUDE.md、skill 里要求“写完要补测试并运行”，但模型还是会偶尔忘记
那业务 agent 的验证到底该怎么做
动作后验证到底是什么
它在 agent harness 里怎么落，以及在仓库规则、验证命令和 CI 流程里怎么体现

如果你还没看前面两篇，可以先从《01. AI Agent 与 Harness：概念梳理》和《02. AI Agent 与 Harness：从 Prompt 到 Harness》开始，再回来看这一篇会更顺。

很多团队其实已经有了 V1 级别的 agent setup，但还没有真正进入 V2 agent harness。

比如开发团队里，大家已经开始做这些事：

指定统一使用 Codex 或 Claude Code
写 AGENTS.md / CLAUDE.md
把代码规范、框架规范、提交流程整理成 skill
推荐安装 dbhub MCP、GitHub MCP、fetch MCP
固定常用命令、目录结构和交付格式

这些都很有价值，而且已经远远不只是“写好提示词”了。
但它们更多解决的是：

怎么给 agent 足够的上下文
怎么统一团队使用方式
怎么让 agent 更容易做事

这更多还是：

02. AI Agent 与 Harness：从 Prompt 到 Harness

Sun, 29 Mar 2026 10:00:00 +0800

引言

这几年看 AI 相关讨论，一个很明显的变化是：大家聊的话题一直在往外扩。

最开始聊的是 prompt，后来开始聊 context、tool calling、workflow，再到这两年越来越常见的 harness engineering。

表面上看，好像只是名词越来越多。但如果把这些讨论放回工程语境里，它们其实指向的是同一个变化：任务越来越像真实系统问题，单次提示词已经不够解释 agent 的表现了。

这篇文章想回答的，就是这个问题：

为什么今天大家会从 prompt engineering，一路谈到 context engineering，最后谈到 harness engineering？

如果你更想继续往后读：

验证落地篇：03. AI Agent 与 Harness：V2 Harness 的验证设计
工程落地篇：05. AI Agent 与 Harness：Agent Harness、Graph 与退款 Agent
团队落地篇：04. AI Agent 与 Harness：Repo Instructions、Skills 与团队工作流
外部文章拆解：番外. AI Agent 与 Harness：Anthropic 和 LangChain 的 Harness Engineering

harness engineering 之所以变成热词，不是因为大家突然发明了一个新名词，而是因为任务复杂度真的变了。

当任务还只是一次性问答时，prompt 就已经很有用
当任务开始跨多轮、多工具、多状态、多系统时，光靠 prompt 就不够了
一旦目标从“回答得像”变成“真的做完并且做对”，系统设计就自然会压过单次提示词技巧

AI 讨论的重心，正在从“怎么让模型更会说”，转向“怎么让系统更稳定地做完”。

为什么今天大家会频繁谈 harness

过去很多讨论会把注意力放在：

模型版本
提示词技巧
上下文长度
是否支持工具调用

这些当然都重要。
但一旦模型开始进入真实业务系统，大家很快就会撞上另一类问题：

01. AI Agent 与 Harness：概念梳理

Sun, 29 Mar 2026 09:00:00 +0800

引言

最近一直在反复想几个词：agent、harness、skill、tool、MCP、context、memory。
它们在视频、推文、产品宣传、框架文档里经常被混着说，结果就是每个词都像懂了，又都不算真懂。

这篇文章想做的事很简单：把这些词放回工程语境里，先理顺它们之间的关系，再把这组文章的阅读顺序摆清楚。

总结

Model / LLM 是底层推理与生成能力，不等于完整 agent
Agent 是带有目标、状态、工具使用和多步行动能力的 LLM 系统
Harness 不是某个单独组件，而是让 agent 稳定完成任务的整套工程化装置
Skill、Tool、MCP 往往都是 harness 的组成部分，但它们单独都不等于 harness
Prompt engineering 解决的是“怎么说”，context engineering 解决的是“让模型看到什么”，harness engineering 解决的是“怎么让整个系统稳地做完”

压成一句话就是：

model 负责想，agent 负责持续做，harness 负责让它做得稳、做得可控。

概念地图

Model
- 提供理解、推理、生成能力
Prompt
- 决定你怎么和模型说话
Context
- 决定当前这一轮让模型看见什么
Memory
- 决定哪些经验和状态可以跨轮次复用
Tool
- 决定 agent 能调用哪些外部能力
MCP
- 决定外部系统如何以统一方式接进来
Skill
- 决定一类任务该按什么方法做
Agent
- 决定系统是否能围绕目标持续行动
Harness
- 决定这个 agent 最终能不能稳定、可控、可交付

从工程视角，三者的包含关系更像：

harness 包含 agent，agent 使用 model

也就是：

model 是能力底座，是 agent 的推理内核
agent 是基于 model 搭起来的行动闭环：model + state + tool use + planning + action loop
harness 是把整个 agent 包裹起来的工程装置：上下文、工具、权限、验证、返工、观测——都在里面

Model、Prompt、Context、Memory 到底是什么关系

Model 比较像大脑。