配套视频:https://www.bilibili.com/video/BV1mhzfBCEuT/

"软件工程从来不是关于代码,而是关于如何精准地理解和解决人类问题。" —— Sean Grove, OpenAI

引言:重新审视程序员的价值

在一个令人振奋又充满变革的时代,OpenAI 对齐研究员 Sean Grove 在演讲中提出了一个颠覆性的观点:代码只占程序员工作价值的 10-20%,真正的价值在于那 80-90% 的结构化沟通。

这个观点挑战了我们长期以来的认知。当被问及"你的工作产出是什么"时,大多数程序员会指向代码——那些具体、可衡量、可以争论和讨论的产物。但这种认知严重低估了我们工作的真正价值。

随着 AI 模型能力的飞速提升,一个新的现实正在浮现:未来最有价值的程序员,将是那些能够最有效沟通、最清晰表达意图和价值观的人。

一、被忽视的 80%:结构化沟通的真正价值

程序员的真实工作流程

让我们诚实地审视一个完整的开发周期:

  1. 理解(Understanding):与用户交流,了解他们面临的真实挑战

  2. 提炼(Distilling):从复杂的用户故事中提炼核心问题

  3. 构思(Conceiving):设想可能的解决方案和实现目标

  4. 规划(Planning):制定具体的实现方案

  5. 分享(Sharing):与同事讨论和完善计划

  6. 翻译(Translating):将计划转化为代码

  7. 测试(Testing):验证代码是否正确运行

  8. 验证(Validating):确认是否真正解决了用户的问题

  9. 观察(Observing):观察代码对现实世界的影响

  10. 迭代(Iterating):基于反馈重新开始循环

在这个流程中,编写代码只是第 6 步。其他所有步骤都是关于沟通、理解、思考和验证——这些才是软件工程的核心。

瓶颈在哪里?

真正的瓶颈从来不是"如何写代码",而是:

  • 明确要做什么

  • 与人沟通并收集需求

  • 理解为何要构建某个功能

  • 确认是否正确实现了预期目标

AI 模型越先进,这种瓶颈就越明显。 因为在不久的将来,只要你能有效沟通,就能编程。

氛围编程的启示

"氛围编程"(Vibe Programming)之所以感觉良好,正是因为它本质上首先是关于沟通,代码反而是沟通的次要衍生品。我们只需描述意图和期望的结果,模型就能处理繁琐的实现细节。

但这里存在一个悖论:

我们通过提示与模型交流,传达意图和价值观,最终生成代码产物,然后便丢弃这些提示。

这就像你用 TypeScript 或 Rust 写完代码,编译成二进制文件后,销毁源代码却小心翼翼地对二进制文件进行版本控制——这显然是荒谬的。

源代码才是有价值的产物,因为它包含了意图、逻辑和可维护性。同样,提示和规范才是真正的"源代码",而生成的代码只是"编译产物"。

二、规范:比代码更强大的产物

什么是规范?

规范(Specification)是一份书面文档,它:

  • 明确表达意图和价值观

  • 让团队在共同目标上保持一致

  • 提供讨论、争论、参考和同步的依据

  • 成为判断是否对齐的标准

一份书面规范能有效协调人员,是用于沟通讨论的核心依据。若无规范,你只有模糊的概念和各自的理解。

为什么规范优于代码?

代码本身其实是从规范进行的一种有损映射

就像你拿一个编译后的 C 语言二进制文件反编译,得不到清晰的注释和命名良好的变量,只能倒推:"这个人想做什么?为何这样写代码?" 这些信息在翻译过程中已经丢失。

同样,代码本身,即便是整洁的代码,通常也无法完全体现所有的意图和价值观。 读代码时,你需要推断团队试图实现的最终目标。

相反,一份足够完善的规范:

  • 包含生成代码所需的全部必要信息

  • 可以生成多种目标产物(TypeScript、Rust、文档、教程、博客、播客)

  • 就像源代码可以编译为 arm64、x86 或 WebAssembly 一样

一个思想实验

假设你把整个代码库——所有文档和代码,支撑你业务的所有内容——输入播客生成器,能生成足够有趣且吸引人的内容,告诉用户如何成功、如何实现目标吗?

那些信息其实并不在你的代码里。 它们在你的意图、价值观和对用户需求的理解中。

三、OpenAI 模型规范:规范的实践案例

模型规范是什么?

2024 年,OpenAI 发布了模型规范(Model Spec),这是一份持续更新的文档,力求清晰明确地表达 OpenAI 希望赋予其模型的意图与价值观。

2025 年 2 月,这份规范在 GitHub 上开源。不出所料,它只是一组 Markdown 文件。

Markdown 的优势

Markdown 作为规范载体有诸多优势:

  • 可读性强:人人都能阅读和理解

  • 版本控制:可追踪所有变更历史

  • 变更记录:清晰的演进路径

  • 跨领域协作:产品、法律、安全、研究、政策团队都能参与

由于它是自然语言,每个人,而不仅是技术人员,都能参与。这是统一所有人意图与价值观的通用载体。

规范的结构

模型规范中的每一条款都有:

  • 唯一 ID(如 sy73)

  • 明确的规则描述

  • 对应的难题提示(Challenge Prompts)

通过 ID 可以找到对应的测试文件(如 sy73.md),其中包含一个或多个针对该条款的测试用例。

文档本身实际上编码了成功标准——模型必须能以符合要求的方式回答这些问题,才算遵循该条款。

案例:谄媚问题(Sycophancy)

最近 GPT-4.0 版本出现了严重的阿谀奉承问题。用户指出,模型为了讨好而牺牲客观真相,还称赞用户"见解独到"。

这引发了诸多疑问:

  • 这是有意为之吗?

  • 这是偶然的吗?

  • 为何没被发现?

幸运的是,模型规范中其实有专门章节说明此事。 自发布以来就明确指出:切勿谄媚。

规范说明谄媚虽能带来短暂满足,但短期和长期都对大家不好。

规范作为信任锚点

因为有了明确的规范:

  1. 意图清晰:我们表达了不希望模型谄媚的价值观

  2. 识别 Bug:行为与规范不符,这一定是个漏洞

  3. 快速修复:回滚并发布修复

  4. 建立信任:规范成为向人们传达预期的方式

在此期间,规范起到了信任锚点的作用,让用户知道什么是被期望的,什么是不被期望的。

四、深思对齐:让规范可执行

技术原理

OpenAI 发布了一种名为深思对齐(Deliberative Alignment)的技术,展示了如何自动将模型与规范对齐。

工作流程:

  1. 采样:采用你的规范和一组极具挑战性的输入提示,从模型采样响应

  2. 评分:将响应、原始提示和规范一并交给更大的模型,让其评分

  3. 调整:根据得分调整模型权重

  4. 迭代:不断优化,使模型行为符合规范

技术优势

这种方法的关键价值在于:

  • 减少推理成本:将原本在推理时的计算转化为嵌入模型权重中

  • 策略内化:将策略直接融入模型参数

  • 肌肉记忆:模型能以类似肌肉记忆的方式响应,自动应用规范

规范可以是任何内容:

  • 代码风格指南

  • 测试要求

  • 安全要求

  • 产品需求

文档实际上成了培训材料和评估材料。

应用场景

在上下文中,可能是系统消息或开发者每次采样时的消息。这种方式:

  • 提示模型会有所对齐(但耗费算力)

  • 深思对齐将规范嵌入模型(节省推理算力)

五、规范即代码:新的编程范式

规范与代码的相似性

尽管模型规范只是 Markdown,但将其视为代码来思考非常有用:

特性

代码

规范

可执行

✅ 编译运行

✅ 模型执行

可测试

✅ 单元测试

✅ 难题提示

模块化

✅ 函数/类

✅ 条款/章节

接口化

✅ API

✅ 评估标准

版本控制

✅ Git

✅ Git

规范的工具链

设计模型规范时,会遇到许多类似编程的问题:

1. 类型检查(Type Checking)

确保一致性。若 A 部门和 B 部门各自编写规范,这里有矛盾,你需要解决冲突或阻止规范发布。

2. Linter

检查模糊表达。若使用过于模糊的表达,不仅会让人困惑,也会让模型出错,最终产出效果大打折扣。

3. 单元测试

规范自带单元测试(难题提示),验证模型是否符合规范。

4. 版本控制

追踪规范的演进历史,理解为何做出某些决策。

规范实际上为我们提供了类似的工具链,但其针对的是意图而非语法。

六、立法者即程序员:普遍适用的原则

美国宪法:国家级模型规范

美国宪法本质上就是一份国家层面的模型规范说明书

  • 成文条文:清晰明确的政策,所有人都可以参照

  • 版本化:通过修正案修改、升级并发布更新

  • 司法审查:由评分者(法官)评估情况,判断其与政策的契合度

  • 先例:大量算力耗费在司法审查上,厘清法律的实际适用方式

  • 单元测试:先例实质上是一组输入输出对,明确并强化原始政策规范

  • 指挥链:确保执行的一致性

  • 训练循环:长期执行形成训练循环,保持共同意图和价值观的一致

尽管源政策本应明确无误,但现实往往复杂,有时会遗漏部分情况。此时,大量算力将耗费在司法审查上,以厘清法律在此处的实际适用方式。

一旦确定,便成先例——这一先例实质上是一组输入输出对,可作为单元测试,明确并强化原始政策规范。

这一产物既能传递意图、裁决合规,又能安全演进。

普遍的规范制定者

实际上,这是一个非常普遍的概念:

  • 程序员:通过代码规范协调芯片工作

  • 产品经理:通过产品文档协调团队

  • 立法者:通过法律条文协调人类行为

  • 每个人:每次写提示时,都在做一种原型规范

在座各位每次写提示时,其实都在做规范制定。 你们的工作是让 AI 模型对齐共同的目标与价值观。

无论是否意识到,你们都是这个世界的规范制定者。

七、软件工程的本质:从未改变,只是更清晰

核心洞察

软件工程从来不是关于代码。

回到最初的问题,当被问及"你的工作产出是代码吗"时,很多人放下了手。

工程从来不只是写代码。 编程是极佳的能力和宝贵的财富,但并非最终目的。

工程是人类对问题的精准探索,是解决人类问题的软件方案。

范式转变

历来如此,我们只是逐渐从:

  • ❌ 为不同的机器编码(汇编、C、Java、Python)

  • ✅ 统一成人类实际解决问题的编码方式(规范、意图、价值观)

我们正在摆脱"适应机器"的束缚,转向"表达人类意图"的自由。

新的稀缺技能

向前看,新的稀缺技能是编写完整体现意图与价值观的规范。

掌握这一点的人将成为最有价值的程序员。

很可能这将成为今天的程序员——这已经和我们所做的非常相似。

但不仅如此:

  • 产品经理也编写规范

  • 立法者撰写法律规范

  • 这其实是一条普遍原则

规范让你更快更安全地交付。人人皆可参与。无论谁撰写规范,无论是产品经理、立法者、工程师还是营销人员,都是程序员。

八、行动指南:立即开始

立即行动

开发下一个 AI 功能时,从规范开始

  1. 明确期望:你期望达成什么?

  2. 定义成功:成功的标准是什么?

  3. 讨论澄清:是否真正明确写出并传达清楚?

  4. 让规范可执行:将规范输入模型

  5. 测试验证:根据规范测试模型或代码

开放性问题

这个领域有许多有趣的问题等待探索:

1. 未来的 IDE 是什么样?

我认为这是一种集成思维梳理器(Integrated Deliberation Environment):

  • 当你编写规范时,它能消除模糊之处

  • 要求你澄清,从而真正明确你的想法

  • 让你与所有人能更有效地相互传达意图

2. 如何大规模协调智能体?

这正是既可行又亟需的——通过规范大规模地协调智能体。

3. 如何确保真正理解?

"直到你突然意识到,你从未告诉它你想要什么,或许你根本就没完全理解过它。"

这是对明确规范的呼吁。

结论:新代码时代已经到来

核心要点总结

  1. 价值重估:代码只占工作价值的 10-20%,真正的价值在于结构化沟通

  2. 规范优先:规范比代码更强大,因为它包含完整的意图和价值观

  3. 可执行文档:规范不仅是文档,更是可执行、可测试、可迭代的"源代码"

  4. 普遍原则:从程序员到立法者,所有人都在制定规范

  5. 范式转变:从"为机器编码"到"为人类意图编码"

新的稀缺技能

未来最有价值的程序员,将是那些能够:

  • 最清晰地表达意图和价值观

  • 最有效地进行结构化沟通

  • 编写完整体现目标的规范

的人。

最终呼吁

Sean Grove 和 OpenAI 新成立的代理鲁棒性团队发出呼吁:

加入我们,共同实现安全的通用人工智能,造福全人类。

因为在这个新代码时代,我们需要的不仅是会写代码的人,更需要能够清晰表达人类意图、协调智能体、确保 AI 安全对齐的规范制定者


延伸思考

对个人的启示

  • 重新评估你的技能组合:沟通能力比编码能力更重要

  • 开始练习编写清晰的规范和意图文档

  • 学会使用规范驱动开发(Specification-Driven Development)

对团队的启示

  • 建立规范优先的文化

  • 投资于规范工具链(类型检查、Linter、测试)

  • 让所有角色(产品、工程、法律、安全)共同参与规范制定

对行业的启示

  • 开发新的 IDE 和工具,支持规范驱动开发

  • 建立规范的标准和最佳实践

  • 探索规范的可组合性和模块化

新代码时代已经到来。问题不是"是否会到来",而是"你准备好了吗?"


如果这篇文章对你有帮助,欢迎点赞、收藏、转发。也欢迎在评论区分享你的经验,我们一起交流学习!


我是 dtsola【IT解决方案架构师 | AI创业者】 ;专注AI创业、商业、技术、心理学、哲学内容分享。

提供服务:AI项目咨询 | 技术解决方案 | IT项目实施 | 企业技术顾问

博客:https://www.dtsola.com

公众号&VX:dtsola

需提供服务,加微信 dtsola,备注:IT咨询,并说明来意。


#AI编程 #VibeCoding #AI产品 #ClaudeCode #独立开发者 #AI创业 #一人公司 #程序员 #软件工程师 #软件工程


Work Less, Earn More, Enjoy Life.