<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>MCP on 星澜</title>
    <link>/tags/mcp/</link>
    <description>Recent content in MCP on 星澜</description>
    <generator>Hugo</generator>
    <language>zh-CN</language>
    <lastBuildDate>Sun, 29 Mar 2026 13:00:00 +0800</lastBuildDate>
    <atom:link href="/tags/mcp/rss.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>04. AI Agent 与 Harness：Repo Instructions、Skills 与团队工作流</title>
      <link>/post/2026/03/29/2026032904/</link>
      <pubDate>Sun, 29 Mar 2026 13:00:00 +0800</pubDate>
      <guid>/post/2026/03/29/2026032904/</guid>
      <description>&lt;h2 id=&#34;引言&#34;&gt;引言&lt;/h2&gt;&#xA;&lt;p&gt;前面两篇篇把概念、演进背景和验证设计铺开了，从这篇开始落地。&lt;/p&gt;&#xA;&lt;p&gt;《&lt;a href=&#34;/post/2026/03/29/2026032901/&#34;&gt;01. AI Agent 与 Harness：概念梳理&lt;/a&gt;》里提到两类场景，这篇先讲第一类：对大多数团队来说，眼前更现实的任务并不是马上造一套业务 agent 系统，而是先把 &lt;code&gt;Codex&lt;/code&gt;、&lt;code&gt;Claude Code&lt;/code&gt; 这类现成 agent 用稳。&lt;/p&gt;&#xA;&lt;p&gt;这时候真正需要补的，就是团队自己的那层 harness——仓库里的这些东西：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;repo instructions&lt;/li&gt;&#xA;&lt;li&gt;skills&lt;/li&gt;&#xA;&lt;li&gt;MCP 使用约定&lt;/li&gt;&#xA;&lt;li&gt;验证命令&lt;/li&gt;&#xA;&lt;li&gt;交付格式&lt;/li&gt;&#xA;&lt;li&gt;review / CI workflow&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;放到一个典型的后端团队里，这件事会变得很具体：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;Web 框架用 &lt;code&gt;gin&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;数据层用 &lt;code&gt;gorm&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;缓存用 &lt;code&gt;redis&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;已经有链路追踪&lt;/li&gt;&#xA;&lt;li&gt;也能通过 MCP 查日志、查 traces、查数据库&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;问题也会跟着收敛成一句话：&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;在这种团队里，怎么把默认工作方式写成 agent 也能稳定遵守的仓库规则？&lt;/code&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;团队上下文要写清楚&#34;&gt;团队上下文要写清楚&lt;/h2&gt;&#xA;&lt;p&gt;很多团队装了 MCP、写了几句提示词，就以为自己已经在做 harness。&lt;br&gt;&#xA;但如果 agent 连“这个仓库到底怎么工作”都不知道，它其实还是进不了团队的真实语境。&lt;/p&gt;&#xA;&lt;p&gt;所以第一步不是堆工具，而是把上下文写明白。&lt;/p&gt;&#xA;&lt;p&gt;像一个 &lt;code&gt;gin + gorm + redis&lt;/code&gt; 的 Go 团队，至少要把这些共识显式化：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;项目目录结构&lt;/li&gt;&#xA;&lt;li&gt;HTTP 层怎么组织&lt;/li&gt;&#xA;&lt;li&gt;service / repository 怎么分层&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;gorm&lt;/code&gt; 查询和事务怎么写&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;redis&lt;/code&gt; key 命名、TTL 和失效策略怎么定&lt;/li&gt;&#xA;&lt;li&gt;trace 和日志字段怎么打&lt;/li&gt;&#xA;&lt;li&gt;什么命令算基本验证&lt;/li&gt;&#xA;&lt;li&gt;什么结果才算 done&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;这些东西如果只存在于资深同事脑子里，agent 是用不稳的。&lt;/p&gt;</description>
    </item>
    <item>
      <title>01. AI Agent 与 Harness：概念梳理</title>
      <link>/post/2026/03/29/2026032901/</link>
      <pubDate>Sun, 29 Mar 2026 09:00:00 +0800</pubDate>
      <guid>/post/2026/03/29/2026032901/</guid>
      <description>&lt;h2 id=&#34;引言&#34;&gt;引言&lt;/h2&gt;&#xA;&lt;p&gt;最近一直在反复想几个词：&lt;code&gt;agent&lt;/code&gt;、&lt;code&gt;harness&lt;/code&gt;、&lt;code&gt;skill&lt;/code&gt;、&lt;code&gt;tool&lt;/code&gt;、&lt;code&gt;MCP&lt;/code&gt;、&lt;code&gt;context&lt;/code&gt;、&lt;code&gt;memory&lt;/code&gt;。&lt;br&gt;&#xA;它们在视频、推文、产品宣传、框架文档里经常被混着说，结果就是每个词都像懂了，又都不算真懂。&lt;/p&gt;&#xA;&lt;p&gt;这篇文章想做的事很简单：把这些词放回工程语境里，先理顺它们之间的关系，再把这组文章的阅读顺序摆清楚。&lt;/p&gt;&#xA;&lt;h2 id=&#34;总结&#34;&gt;总结&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;Model / LLM&lt;/code&gt; 是底层推理与生成能力，不等于完整 agent&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Agent&lt;/code&gt; 是带有目标、状态、工具使用和多步行动能力的 LLM 系统&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Harness&lt;/code&gt; 不是某个单独组件，而是让 agent 稳定完成任务的整套工程化装置&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Skill&lt;/code&gt;、&lt;code&gt;Tool&lt;/code&gt;、&lt;code&gt;MCP&lt;/code&gt; 往往都是 harness 的组成部分，但它们单独都不等于 harness&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Prompt engineering&lt;/code&gt; 解决的是“怎么说”，&lt;code&gt;context engineering&lt;/code&gt; 解决的是“让模型看到什么”，&lt;code&gt;harness engineering&lt;/code&gt; 解决的是“怎么让整个系统稳地做完”&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;压成一句话就是：&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;model 负责想，agent 负责持续做，harness 负责让它做得稳、做得可控。&lt;/code&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;概念地图&#34;&gt;概念地图&lt;/h2&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;Model&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;提供理解、推理、生成能力&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Prompt&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定你怎么和模型说话&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Context&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定当前这一轮让模型看见什么&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Memory&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定哪些经验和状态可以跨轮次复用&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Tool&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定 agent 能调用哪些外部能力&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;MCP&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定外部系统如何以统一方式接进来&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Skill&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定一类任务该按什么方法做&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Agent&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定系统是否能围绕目标持续行动&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;Harness&lt;/code&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;决定这个 agent 最终能不能稳定、可控、可交付&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;从工程视角，三者的包含关系更像：&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;harness 包含 agent，agent 使用 model&lt;/code&gt;&lt;/p&gt;&#xA;&lt;p&gt;也就是：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;&lt;code&gt;model&lt;/code&gt; 是能力底座，是 agent 的推理内核&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;agent&lt;/code&gt; 是基于 model 搭起来的行动闭环：&lt;code&gt;model + state + tool use + planning + action loop&lt;/code&gt;&lt;/li&gt;&#xA;&lt;li&gt;&lt;code&gt;harness&lt;/code&gt; 是把整个 agent 包裹起来的工程装置：上下文、工具、权限、验证、返工、观测——都在里面&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;h2 id=&#34;modelpromptcontextmemory-到底是什么关系&#34;&gt;Model、Prompt、Context、Memory 到底是什么关系&lt;/h2&gt;&#xA;&lt;p&gt;&lt;code&gt;Model&lt;/code&gt; 比较像大脑。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
