<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Harness on 提笔忘字</title><link>https://imx.ink/harness/</link><description>Recent content in Harness on 提笔忘字</description><generator>Hugo</generator><language>zh-CN</language><copyright>Copyright © 2023, Xie Ziyao.</copyright><lastBuildDate>Sun, 05 Apr 2026 17:00:00 +0800</lastBuildDate><atom:link href="https://imx.ink/harness/index.xml" rel="self" type="application/rss+xml"/><item><title>从 Prompt 到 Harness：AI 工程范式的三级跃迁</title><link>https://imx.ink/tech/2026/04/05/prompt-context-harness-three-shifts/</link><pubDate>Sun, 05 Apr 2026 17:00:00 +0800</pubDate><guid>https://imx.ink/tech/2026/04/05/prompt-context-harness-three-shifts/</guid><description>&lt;img src="https://f005.backblazeb2.com/file/wml5yw8gwgll/20260505/prompt-context-harness-hero.png" alt="Prompt → Context → Harness 的三级跃迁" style="zoom:50%;" /&gt;
&lt;p&gt;最近把一堆关于 Agent / Harness Engineering 的技术分享整理了一遍，发现一个特别清晰的线索——&lt;strong&gt;2023 到 2026 这四年里，AI 工程的&amp;quot;调教对象&amp;quot;发生了三次跃迁&lt;/strong&gt;。而且这三次跃迁不是词汇升级，是问题维度的升级。&lt;/p&gt;
&lt;p&gt;本文记一下这条主线、以及它背后的两个硬事实。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="三级跃迁同一张表"&gt;三级跃迁：同一张表&lt;/h2&gt;
&lt;p&gt;这张表最近在很多技术分享里反复出现，基本可以当作行业共识：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;&lt;/th&gt;
 &lt;th&gt;2023&lt;/th&gt;
 &lt;th&gt;2024–2025&lt;/th&gt;
 &lt;th&gt;2026&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;范式&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Prompt Engineering&lt;/td&gt;
 &lt;td&gt;Context Engineering&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;Harness Engineering&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;在调教什么&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;一句话&lt;/td&gt;
 &lt;td&gt;上下文&lt;/td&gt;
 &lt;td&gt;整个系统&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;期望效果&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;模型听话&lt;/td&gt;
 &lt;td&gt;模型懂项目&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;Agent 可控&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;可调对象&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;Prompt 文本&lt;/td&gt;
 &lt;td&gt;&lt;code&gt;CLAUDE.md&lt;/code&gt; / &lt;code&gt;AGENTS.md&lt;/code&gt; / &lt;code&gt;SKILL.md&lt;/code&gt;&lt;/td&gt;
 &lt;td&gt;循环 / 工具 / 权限 / 上下文 / 成本&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;左边的问题是&amp;quot;这句话怎么说更好&amp;quot;，中间的问题是&amp;quot;模型应该看见哪些信息&amp;quot;，右边的问题完全不一样了——&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;整个系统应该怎么运行，才能保证模型在几小时、多轮、多工具、多会话的条件下，仍能稳定交付结果？&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这不再是对话问题，是&lt;strong&gt;系统工程问题&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="为什么会发生这次跃迁"&gt;为什么会发生这次跃迁？&lt;/h2&gt;
&lt;p&gt;两个硬事实推着它发生。&lt;/p&gt;
&lt;h3 id="事实一从-l1-chatbot-到-l3-agent单次-token-消耗涨了-100-倍"&gt;事实一：从 L1 Chatbot 到 L3 Agent，单次 Token 消耗涨了 100 倍&lt;/h3&gt;
&lt;p&gt;业界一组被多次引用的数据：&lt;/p&gt;</description></item></channel></rss>