
你好,我是 dtsola,IT解决方案架构师,同时也是一人公司的实践者,正在打造 小遥AI社区。
最近 AI 圈又炸了一个词:Harness Engineering,驾驭工程。
OpenAI 在博客里提了一句,然后各路账号开始铺天盖地地解读。我刷到的大多数内容,要么在堆概念,要么在蹭热点。
我没有急着跟风。
因为我在一人公司里用 AI 干活已经有一段时间了,我知道这个词背后指的是什么——它不是新东西,它是我每天都在做、但一直没有一个准确名字的那件事。
今天我想用自己的方式,把提示词工程、上下文工程、驾驭工程这三个概念串起来讲清楚。
不是科普,是实战视角。
你以为学会提示词就够了
大多数人接触 AI 编程的第一课,都是提示词工程。
逻辑很直接:大模型的本质是在预测"下一个词最可能是什么",它只是在猜你想要什么。你给的指令越清晰,它猜得越准。
于是大家开始研究怎么写提示词——加角色设定、加背景、加输出格式、加限制条件……
这没有错。提示词工程确实有用,它解决的是大模型无引导、乱说话的问题。
但我在实战中很快就撞到了天花板。
提示词写得再好,只要项目稍微复杂一点,AI 给的结果就开始飘。不是因为提示词写得不够好,而是因为模型知道的信息不够。
你丢给它一个任务,它不知道你的项目背景,不知道你的技术栈,不知道你上次做了什么决策、为什么这么做。它每次都像一个刚入职的新员工,从零开始理解你的世界。
提示词解决的是"怎么说话"的问题,但没解决"说什么"的问题。
上下文工程:真正拉开差距的地方
这就是上下文工程要做的事。
发给大模型的所有信息,统称为上下文。提示词只是其中一部分。项目文档、历史对话、当前代码、报错信息……这些打包在一起,才是完整的上下文。
道理很简单:给的信息越精准,模型回答越准。
但问题来了——大模型一次能处理的上下文有上限,叫上下文窗口。信息塞多了,就得压缩、就得丢弃。丢着丢着,关键信息没了,模型开始记不住,前后回答开始矛盾。
这叫上下文腐化。做过稍微长一点的 AI 编程任务的人,应该都遇到过这个感觉:越聊越跑偏,越改越乱。
上下文工程要解决的,就是在有限的窗口里,把最相关的信息在最合适的时机塞进去。
具体怎么做?三步:召回、压缩、组装。
找到最相关的信息,把它压缩到合适的体量,再按照对模型理解最有利的顺序组装好,然后发出去。
这也是为什么同一个模型,不同 AI 工具效果差这么多。Cursor、Claude Code、Windsurf,底层可能都在调同一个模型,但上下文的处理策略完全不同,最终输出的质量自然天差地别。
你选工具,选的不是模型,选的是上下文工程的实现水平。
驾驭工程:从"会聊天"到"真干活"
提示词工程和上下文工程解决了"让模型说对话"的问题。
但模型说得再对,它还是只能聊天。
它没法帮你真正干活。
要让模型真正执行任务——读文件、写代码、跑测试、修报错——就需要给它配上执行能力:Bash 沙箱、文件系统、MCP 工具调用……这些构成了执行层。
有了执行层,模型就能一边思考、一边行动,执行结果再反馈回上下文,驱动下一轮推理。这个循环就是 ReAct,这个能帮你执行任务的程序,就是 AI Agent。
Agent 的本质,是一个 for 循环。
但循环一长,问题就来了:上下文膨胀、目标漂移、越跑越偏,甚至陷入无效死循环。
所以 Harness Engineering 在执行层之外,还需要三层东西:
记忆层——把项目目标、技术栈、代码规范、禁止事项这些核心信息,写成规则文件(比如 CLAUDE.md),每次调用时自动注入上下文。不管循环跑多长,大框架始终在。
反馈层——把测试输出、Linter 报错、运行结果自动加回上下文,让 Agent 在下一轮循环里自己修复问题,形成自动修复闭环。
编排层——把大任务拆解成有明确完成标准的子任务,按规划驱动 Agent 分步执行,避免它在没有终点的循环里空转。
编排层 + 执行层 + 反馈层 + 记忆层,这四层合在一起,就是 Harness Engineering,驾驭工程。
它是包裹着大模型的工程外壳。大模型越强,外壳可以越薄,但这层外壳永远得有。
公式就一个:
Agent = 大模型 + Harness
凡是不属于大模型本身的那部分,都是 Harness Engineering 的范畴。
对一人公司来说,这意味着什么
我用一人公司的视角来翻译一下这四层:
记忆层 = 你的项目文档体系,你对 AI 员工的"入职手册"
执行层 = 你的 AI 员工,能真正动手干活的那个
反馈层 = 你的质量把控机制,不用你盯着,它自己会检查
编排层 = 你的项目管理能力,把大目标拆成能落地的小任务
这四层搭好了,一个人真的可以干出团队的活。
落地从哪里开始?从最简单的一步:把你的 CLAUDE.md 或 .cursorrules 认真写起来。
写清楚项目背景、技术栈、你希望 AI 做什么、不做什么、做完要跑哪些测试。这一步,很多人跳过了,然后抱怨 AI 写的代码乱七八糟。
规则文件写好了,你就完成了记忆层的搭建。这是成本最低、收益最直接的起点。
进阶一点,可以引入 Spec Driven Development(SDD,规范驱动开发)的思路——先明确需求和约束,再制定开发计划,最后才是执行。每个阶段都更新一次规则文件,确保 Agent 每一步都在正确的轨道上。
程序员的工作,正在悄悄变成另一件事
有了 Harness Engineering,程序员的工作内容正在发生一个根本性的变化:
从写代码,变成写规则和 Skill。
你不再是那个一行一行敲代码的人,你是那个定义规则、设计流程、把控质量的人。
有句话说得很妙:那些拿了 N+1 的同事,其实从未离开你——他们只是变成了 Skill,默默陪伴着你。
暖不暖心先不说,但这件事是真的在发生。
我的判断是:存量程序员的新主战场,不是学会用哪个 AI 工具,而是学会构建自己的 Harness。
模型会越来越强,工具会越来越多,但那个能把模型真正驾驭起来、持续交付结果的工程能力——那是你的。
最后做个总结,三层工程各自解决的问题:
提示词工程:让大模型听懂你说的话,按你要的格式输出
上下文工程:给大模型注入精准有效的信息,减少腐化
驾驭工程:让大模型持续按规范执行任务,真正交付结果
这三层,是 AI 编程从"能用"到"好用"到"真正干活"的完整路径。
别停在第一层。
欢迎来 小遥AI社区 一起交流,我们都在路上。
— dtsola,IT 解决方案架构师 | 一人公司实践者
小遥社区:https://project.xiaoyaosai.com/
Vibe Coding 工具推荐:https://s5e.me/Yasaxy
加入社区 与 小遥一起成长 ↓

#HarnessEngineering #驾驭工程 #AI编程 #VibeCoding #独立开发者 #一人公司 #程序员转型 #AgentDev #上下文工程 #提示词工程