你好,我是 dtsola,IT解决方案架构师,同时也是一人公司的实践者,正在打造 小遥AI社区


最近 AI 圈又炸了一个词:Harness Engineering,驾驭工程

OpenAI 在博客里提了一句,然后各路账号开始铺天盖地地解读。我刷到的大多数内容,要么在堆概念,要么在蹭热点。

我没有急着跟风。

因为我在一人公司里用 AI 干活已经有一段时间了,我知道这个词背后指的是什么——它不是新东西,它是我每天都在做、但一直没有一个准确名字的那件事。

今天我想用自己的方式,把提示词工程、上下文工程、驾驭工程这三个概念串起来讲清楚。

不是科普,是实战视角。


你以为学会提示词就够了

大多数人接触 AI 编程的第一课,都是提示词工程。

逻辑很直接:大模型的本质是在预测"下一个词最可能是什么",它只是在猜你想要什么。你给的指令越清晰,它猜得越准。

于是大家开始研究怎么写提示词——加角色设定、加背景、加输出格式、加限制条件……

这没有错。提示词工程确实有用,它解决的是大模型无引导、乱说话的问题。

但我在实战中很快就撞到了天花板。

提示词写得再好,只要项目稍微复杂一点,AI 给的结果就开始飘。不是因为提示词写得不够好,而是因为模型知道的信息不够

你丢给它一个任务,它不知道你的项目背景,不知道你的技术栈,不知道你上次做了什么决策、为什么这么做。它每次都像一个刚入职的新员工,从零开始理解你的世界。

提示词解决的是"怎么说话"的问题,但没解决"说什么"的问题。


上下文工程:真正拉开差距的地方

这就是上下文工程要做的事。

发给大模型的所有信息,统称为上下文。提示词只是其中一部分。项目文档、历史对话、当前代码、报错信息……这些打包在一起,才是完整的上下文。

道理很简单:给的信息越精准,模型回答越准。

但问题来了——大模型一次能处理的上下文有上限,叫上下文窗口。信息塞多了,就得压缩、就得丢弃。丢着丢着,关键信息没了,模型开始记不住,前后回答开始矛盾。

这叫上下文腐化。做过稍微长一点的 AI 编程任务的人,应该都遇到过这个感觉:越聊越跑偏,越改越乱。

上下文工程要解决的,就是在有限的窗口里,把最相关的信息在最合适的时机塞进去

具体怎么做?三步:召回、压缩、组装。

找到最相关的信息,把它压缩到合适的体量,再按照对模型理解最有利的顺序组装好,然后发出去。

这也是为什么同一个模型,不同 AI 工具效果差这么多。Cursor、Claude Code、Windsurf,底层可能都在调同一个模型,但上下文的处理策略完全不同,最终输出的质量自然天差地别。

你选工具,选的不是模型,选的是上下文工程的实现水平。


驾驭工程:从"会聊天"到"真干活"

提示词工程和上下文工程解决了"让模型说对话"的问题。

但模型说得再对,它还是只能聊天。

它没法帮你真正干活。

要让模型真正执行任务——读文件、写代码、跑测试、修报错——就需要给它配上执行能力:Bash 沙箱、文件系统、MCP 工具调用……这些构成了执行层

有了执行层,模型就能一边思考、一边行动,执行结果再反馈回上下文,驱动下一轮推理。这个循环就是 ReAct,这个能帮你执行任务的程序,就是 AI Agent

Agent 的本质,是一个 for 循环。

但循环一长,问题就来了:上下文膨胀、目标漂移、越跑越偏,甚至陷入无效死循环。

所以 Harness Engineering 在执行层之外,还需要三层东西:

记忆层——把项目目标、技术栈、代码规范、禁止事项这些核心信息,写成规则文件(比如 CLAUDE.md),每次调用时自动注入上下文。不管循环跑多长,大框架始终在。

反馈层——把测试输出、Linter 报错、运行结果自动加回上下文,让 Agent 在下一轮循环里自己修复问题,形成自动修复闭环。

编排层——把大任务拆解成有明确完成标准的子任务,按规划驱动 Agent 分步执行,避免它在没有终点的循环里空转。

编排层 + 执行层 + 反馈层 + 记忆层,这四层合在一起,就是 Harness Engineering,驾驭工程。

它是包裹着大模型的工程外壳。大模型越强,外壳可以越薄,但这层外壳永远得有。

公式就一个:

Agent = 大模型 + Harness

凡是不属于大模型本身的那部分,都是 Harness Engineering 的范畴。


对一人公司来说,这意味着什么

我用一人公司的视角来翻译一下这四层:

  • 记忆层 = 你的项目文档体系,你对 AI 员工的"入职手册"

  • 执行层 = 你的 AI 员工,能真正动手干活的那个

  • 反馈层 = 你的质量把控机制,不用你盯着,它自己会检查

  • 编排层 = 你的项目管理能力,把大目标拆成能落地的小任务

这四层搭好了,一个人真的可以干出团队的活。

落地从哪里开始?从最简单的一步:把你的 CLAUDE.md.cursorrules 认真写起来。

写清楚项目背景、技术栈、你希望 AI 做什么、不做什么、做完要跑哪些测试。这一步,很多人跳过了,然后抱怨 AI 写的代码乱七八糟。

规则文件写好了,你就完成了记忆层的搭建。这是成本最低、收益最直接的起点。

进阶一点,可以引入 Spec Driven Development(SDD,规范驱动开发)的思路——先明确需求和约束,再制定开发计划,最后才是执行。每个阶段都更新一次规则文件,确保 Agent 每一步都在正确的轨道上。


程序员的工作,正在悄悄变成另一件事

有了 Harness Engineering,程序员的工作内容正在发生一个根本性的变化:

从写代码,变成写规则和 Skill。

你不再是那个一行一行敲代码的人,你是那个定义规则、设计流程、把控质量的人。

有句话说得很妙:那些拿了 N+1 的同事,其实从未离开你——他们只是变成了 Skill,默默陪伴着你。

暖不暖心先不说,但这件事是真的在发生。

我的判断是:存量程序员的新主战场,不是学会用哪个 AI 工具,而是学会构建自己的 Harness。

模型会越来越强,工具会越来越多,但那个能把模型真正驾驭起来、持续交付结果的工程能力——那是你的。


最后做个总结,三层工程各自解决的问题:

  • 提示词工程:让大模型听懂你说的话,按你要的格式输出

  • 上下文工程:给大模型注入精准有效的信息,减少腐化

  • 驾驭工程:让大模型持续按规范执行任务,真正交付结果

这三层,是 AI 编程从"能用"到"好用"到"真正干活"的完整路径。

别停在第一层。

欢迎来 小遥AI社区 一起交流,我们都在路上。


— dtsola,IT 解决方案架构师 | 一人公司实践者

小遥社区:https://project.xiaoyaosai.com/

Vibe Coding 工具推荐:https://s5e.me/Yasaxy


加入社区 与 小遥一起成长 ↓


#HarnessEngineering #驾驭工程 #AI编程 #VibeCoding #独立开发者 #一人公司 #程序员转型 #AgentDev #上下文工程 #提示词工程

Work Less, Earn More, Enjoy Life.