04. AI Agent 与 Harness：Repo Instructions、Skills 与团队工作流

Sun, 29 Mar 2026 13:00:00 +0800

引言

前面两篇篇把概念、演进背景和验证设计铺开了，从这篇开始落地。

《01. AI Agent 与 Harness：概念梳理》里提到两类场景，这篇先讲第一类：对大多数团队来说，眼前更现实的任务并不是马上造一套业务 agent 系统，而是先把 Codex、Claude Code 这类现成 agent 用稳。

这时候真正需要补的，就是团队自己的那层 harness——仓库里的这些东西：

放到一个典型的后端团队里，这件事会变得很具体：

问题也会跟着收敛成一句话：

在这种团队里，怎么把默认工作方式写成 agent 也能稳定遵守的仓库规则？

很多团队装了 MCP、写了几句提示词，就以为自己已经在做 harness。
但如果 agent 连“这个仓库到底怎么工作”都不知道，它其实还是进不了团队的真实语境。

所以第一步不是堆工具，而是把上下文写明白。

像一个 gin + gorm + redis 的 Go 团队，至少要把这些共识显式化：

这些东西如果只存在于资深同事脑子里，agent 是用不稳的。

Sun, 29 Mar 2026 09:00:00 +0800

最近一直在反复想几个词：agent、harness、skill、tool、MCP、context、memory。
它们在视频、推文、产品宣传、框架文档里经常被混着说，结果就是每个词都像懂了，又都不算真懂。

这篇文章想做的事很简单：把这些词放回工程语境里，先理顺它们之间的关系，再把这组文章的阅读顺序摆清楚。

Model / LLM 是底层推理与生成能力，不等于完整 agent
Agent 是带有目标、状态、工具使用和多步行动能力的 LLM 系统
Harness 不是某个单独组件，而是让 agent 稳定完成任务的整套工程化装置
Skill、Tool、MCP 往往都是 harness 的组成部分，但它们单独都不等于 harness
Prompt engineering 解决的是“怎么说”，context engineering 解决的是“让模型看到什么”，harness engineering 解决的是“怎么让整个系统稳地做完”

压成一句话就是：

model 负责想，agent 负责持续做，harness 负责让它做得稳、做得可控。

从工程视角，三者的包含关系更像：

harness 包含 agent，agent 使用 model

也就是：

Model 比较像大脑。