<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Prompt Engineering on 星澜</title>
    <link>/tags/prompt-engineering/</link>
    <description>Recent content in Prompt Engineering on 星澜</description>
    <generator>Hugo</generator>
    <language>zh-CN</language>
    <lastBuildDate>Sun, 29 Mar 2026 10:00:00 +0800</lastBuildDate>
    <atom:link href="/tags/prompt-engineering/rss.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>02. AI Agent 与 Harness：从 Prompt 到 Harness</title>
      <link>/post/2026/03/29/2026032902/</link>
      <pubDate>Sun, 29 Mar 2026 10:00:00 +0800</pubDate>
      <guid>/post/2026/03/29/2026032902/</guid>
      <description>&lt;h2 id=&#34;引言&#34;&gt;引言&lt;/h2&gt;&#xA;&lt;p&gt;这几年看 AI 相关讨论，一个很明显的变化是：大家聊的话题一直在往外扩。&lt;/p&gt;&#xA;&lt;p&gt;最开始聊的是 &lt;code&gt;prompt&lt;/code&gt;，后来开始聊 &lt;code&gt;context&lt;/code&gt;、&lt;code&gt;tool calling&lt;/code&gt;、&lt;code&gt;workflow&lt;/code&gt;，再到这两年越来越常见的 &lt;code&gt;harness engineering&lt;/code&gt;。&lt;/p&gt;&#xA;&lt;p&gt;表面上看，好像只是名词越来越多。&#xA;但如果把这些讨论放回工程语境里，它们其实指向的是同一个变化：任务越来越像真实系统问题，单次提示词已经不够解释 agent 的表现了。&lt;/p&gt;&#xA;&lt;p&gt;这篇文章想回答的，就是这个问题：&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;为什么今天大家会从 prompt engineering，一路谈到 context engineering，最后谈到 harness engineering？&lt;/code&gt;&lt;/p&gt;&#xA;&lt;p&gt;如果你更想继续往后读：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;验证落地篇：&lt;a href=&#34;/post/2026/03/29/2026032903/&#34;&gt;03. AI Agent 与 Harness：V2 Harness 的验证设计&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;工程落地篇：&lt;a href=&#34;/post/2026/03/29/2026032905/&#34;&gt;05. AI Agent 与 Harness：Agent Harness、Graph 与退款 Agent&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;团队落地篇：&lt;a href=&#34;/post/2026/03/29/2026032904/&#34;&gt;04. AI Agent 与 Harness：Repo Instructions、Skills 与团队工作流&lt;/a&gt;&lt;/li&gt;&#xA;&lt;li&gt;外部文章拆解：&lt;a href=&#34;/post/2026/03/29/2026032906/&#34;&gt;番外. AI Agent 与 Harness：Anthropic 和 LangChain 的 Harness Engineering&lt;/a&gt;&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;&lt;code&gt;harness engineering&lt;/code&gt; 之所以变成热词，不是因为大家突然发明了一个新名词，而是因为任务复杂度真的变了。&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;当任务还只是一次性问答时，prompt 就已经很有用&lt;/li&gt;&#xA;&lt;li&gt;当任务开始跨多轮、多工具、多状态、多系统时，光靠 prompt 就不够了&lt;/li&gt;&#xA;&lt;li&gt;一旦目标从“回答得像”变成“真的做完并且做对”，系统设计就自然会压过单次提示词技巧&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;&lt;code&gt;AI 讨论的重心，正在从“怎么让模型更会说”，转向“怎么让系统更稳定地做完”。&lt;/code&gt;&lt;/p&gt;&#xA;&lt;h2 id=&#34;为什么今天大家会频繁谈-harness&#34;&gt;为什么今天大家会频繁谈 harness&lt;/h2&gt;&#xA;&lt;p&gt;过去很多讨论会把注意力放在：&lt;/p&gt;&#xA;&lt;ul&gt;&#xA;&lt;li&gt;模型版本&lt;/li&gt;&#xA;&lt;li&gt;提示词技巧&lt;/li&gt;&#xA;&lt;li&gt;上下文长度&lt;/li&gt;&#xA;&lt;li&gt;是否支持工具调用&lt;/li&gt;&#xA;&lt;/ul&gt;&#xA;&lt;p&gt;这些当然都重要。&lt;br&gt;&#xA;但一旦模型开始进入真实业务系统，大家很快就会撞上另一类问题：&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
