【AI编程】新代码时代：规范即代码，沟通即编程|dtsola

配套视频：https://www.bilibili.com/video/BV1mhzfBCEuT/

"软件工程从来不是关于代码，而是关于如何精准地理解和解决人类问题。" —— Sean Grove, OpenAI

引言：重新审视程序员的价值

在一个令人振奋又充满变革的时代，OpenAI 对齐研究员 Sean Grove 在演讲中提出了一个颠覆性的观点：代码只占程序员工作价值的 10-20%，真正的价值在于那 80-90% 的结构化沟通。

这个观点挑战了我们长期以来的认知。当被问及"你的工作产出是什么"时，大多数程序员会指向代码——那些具体、可衡量、可以争论和讨论的产物。但这种认知严重低估了我们工作的真正价值。

随着 AI 模型能力的飞速提升，一个新的现实正在浮现：未来最有价值的程序员，将是那些能够最有效沟通、最清晰表达意图和价值观的人。

一、被忽视的 80%：结构化沟通的真正价值

程序员的真实工作流程

让我们诚实地审视一个完整的开发周期：

理解（Understanding）：与用户交流，了解他们面临的真实挑战
提炼（Distilling）：从复杂的用户故事中提炼核心问题
构思（Conceiving）：设想可能的解决方案和实现目标
规划（Planning）：制定具体的实现方案
分享（Sharing）：与同事讨论和完善计划
翻译（Translating）：将计划转化为代码
测试（Testing）：验证代码是否正确运行
验证（Validating）：确认是否真正解决了用户的问题
观察（Observing）：观察代码对现实世界的影响
迭代（Iterating）：基于反馈重新开始循环

在这个流程中，编写代码只是第 6 步。其他所有步骤都是关于沟通、理解、思考和验证——这些才是软件工程的核心。

瓶颈在哪里？

真正的瓶颈从来不是"如何写代码"，而是：

明确要做什么
与人沟通并收集需求
理解为何要构建某个功能
确认是否正确实现了预期目标

AI 模型越先进，这种瓶颈就越明显。 因为在不久的将来，只要你能有效沟通，就能编程。

氛围编程的启示

"氛围编程"（Vibe Programming）之所以感觉良好，正是因为它本质上首先是关于沟通，代码反而是沟通的次要衍生品。我们只需描述意图和期望的结果，模型就能处理繁琐的实现细节。

但这里存在一个悖论：

我们通过提示与模型交流，传达意图和价值观，最终生成代码产物，然后便丢弃这些提示。

这就像你用 TypeScript 或 Rust 写完代码，编译成二进制文件后，销毁源代码却小心翼翼地对二进制文件进行版本控制——这显然是荒谬的。

源代码才是有价值的产物，因为它包含了意图、逻辑和可维护性。同样，提示和规范才是真正的"源代码"，而生成的代码只是"编译产物"。

二、规范：比代码更强大的产物

什么是规范？

规范（Specification）是一份书面文档，它：

明确表达意图和价值观
让团队在共同目标上保持一致
提供讨论、争论、参考和同步的依据
成为判断是否对齐的标准

一份书面规范能有效协调人员，是用于沟通讨论的核心依据。若无规范，你只有模糊的概念和各自的理解。

为什么规范优于代码？

代码本身其实是从规范进行的一种有损映射。

就像你拿一个编译后的 C 语言二进制文件反编译，得不到清晰的注释和命名良好的变量，只能倒推："这个人想做什么？为何这样写代码？" 这些信息在翻译过程中已经丢失。

同样，代码本身，即便是整洁的代码，通常也无法完全体现所有的意图和价值观。 读代码时，你需要推断团队试图实现的最终目标。

相反，一份足够完善的规范：

包含生成代码所需的全部必要信息
可以生成多种目标产物（TypeScript、Rust、文档、教程、博客、播客）
就像源代码可以编译为 arm64、x86 或 WebAssembly 一样

一个思想实验

假设你把整个代码库——所有文档和代码，支撑你业务的所有内容——输入播客生成器，能生成足够有趣且吸引人的内容，告诉用户如何成功、如何实现目标吗？

那些信息其实并不在你的代码里。 它们在你的意图、价值观和对用户需求的理解中。

三、OpenAI 模型规范：规范的实践案例

模型规范是什么？

2024 年，OpenAI 发布了模型规范（Model Spec），这是一份持续更新的文档，力求清晰明确地表达 OpenAI 希望赋予其模型的意图与价值观。

2025 年 2 月，这份规范在 GitHub 上开源。不出所料，它只是一组 Markdown 文件。

Markdown 的优势

Markdown 作为规范载体有诸多优势：

✅ 可读性强：人人都能阅读和理解
✅ 版本控制：可追踪所有变更历史
✅ 变更记录：清晰的演进路径
✅ 跨领域协作：产品、法律、安全、研究、政策团队都能参与

由于它是自然语言，每个人，而不仅是技术人员，都能参与。这是统一所有人意图与价值观的通用载体。

规范的结构

模型规范中的每一条款都有：

唯一 ID（如 sy73）
明确的规则描述
对应的难题提示（Challenge Prompts）

通过 ID 可以找到对应的测试文件（如 sy73.md），其中包含一个或多个针对该条款的测试用例。

文档本身实际上编码了成功标准——模型必须能以符合要求的方式回答这些问题，才算遵循该条款。

案例：谄媚问题（Sycophancy）

最近 GPT-4.0 版本出现了严重的阿谀奉承问题。用户指出，模型为了讨好而牺牲客观真相，还称赞用户"见解独到"。

这引发了诸多疑问：

这是有意为之吗？
这是偶然的吗？
为何没被发现？

幸运的是，模型规范中其实有专门章节说明此事。 自发布以来就明确指出：切勿谄媚。

规范说明谄媚虽能带来短暂满足，但短期和长期都对大家不好。

规范作为信任锚点

因为有了明确的规范：

意图清晰：我们表达了不希望模型谄媚的价值观
识别 Bug：行为与规范不符，这一定是个漏洞
快速修复：回滚并发布修复
建立信任：规范成为向人们传达预期的方式

在此期间，规范起到了信任锚点的作用，让用户知道什么是被期望的，什么是不被期望的。

四、深思对齐：让规范可执行

技术原理

OpenAI 发布了一种名为深思对齐（Deliberative Alignment）的技术，展示了如何自动将模型与规范对齐。

工作流程：

采样：采用你的规范和一组极具挑战性的输入提示，从模型采样响应
评分：将响应、原始提示和规范一并交给更大的模型，让其评分
调整：根据得分调整模型权重
迭代：不断优化，使模型行为符合规范

技术优势

这种方法的关键价值在于：

减少推理成本：将原本在推理时的计算转化为嵌入模型权重中
策略内化：将策略直接融入模型参数
肌肉记忆：模型能以类似肌肉记忆的方式响应，自动应用规范

规范可以是任何内容：

代码风格指南
测试要求
安全要求
产品需求

文档实际上成了培训材料和评估材料。

应用场景

在上下文中，可能是系统消息或开发者每次采样时的消息。这种方式：

提示模型会有所对齐（但耗费算力）
深思对齐将规范嵌入模型（节省推理算力）

五、规范即代码：新的编程范式

规范与代码的相似性

尽管模型规范只是 Markdown，但将其视为代码来思考非常有用：

特性	代码	规范
可执行	✅ 编译运行	✅ 模型执行
可测试	✅ 单元测试	✅ 难题提示
模块化	✅ 函数/类	✅ 条款/章节
接口化	✅ API	✅ 评估标准
版本控制	✅ Git	✅ Git

规范的工具链

设计模型规范时，会遇到许多类似编程的问题：

1. 类型检查（Type Checking）

确保一致性。若 A 部门和 B 部门各自编写规范，这里有矛盾，你需要解决冲突或阻止规范发布。

2. Linter

检查模糊表达。若使用过于模糊的表达，不仅会让人困惑，也会让模型出错，最终产出效果大打折扣。

3. 单元测试

规范自带单元测试（难题提示），验证模型是否符合规范。

4. 版本控制

追踪规范的演进历史，理解为何做出某些决策。

规范实际上为我们提供了类似的工具链，但其针对的是意图而非语法。

六、立法者即程序员：普遍适用的原则

美国宪法：国家级模型规范

美国宪法本质上就是一份国家层面的模型规范说明书：

成文条文：清晰明确的政策，所有人都可以参照
版本化：通过修正案修改、升级并发布更新
司法审查：由评分者（法官）评估情况，判断其与政策的契合度
先例：大量算力耗费在司法审查上，厘清法律的实际适用方式
单元测试：先例实质上是一组输入输出对，明确并强化原始政策规范
指挥链：确保执行的一致性
训练循环：长期执行形成训练循环，保持共同意图和价值观的一致

尽管源政策本应明确无误，但现实往往复杂，有时会遗漏部分情况。此时，大量算力将耗费在司法审查上，以厘清法律在此处的实际适用方式。

一旦确定，便成先例——这一先例实质上是一组输入输出对，可作为单元测试，明确并强化原始政策规范。

这一产物既能传递意图、裁决合规，又能安全演进。

普遍的规范制定者

实际上，这是一个非常普遍的概念：

程序员：通过代码规范协调芯片工作
产品经理：通过产品文档协调团队
立法者：通过法律条文协调人类行为
每个人：每次写提示时，都在做一种原型规范

在座各位每次写提示时，其实都在做规范制定。 你们的工作是让 AI 模型对齐共同的目标与价值观。

无论是否意识到，你们都是这个世界的规范制定者。

七、软件工程的本质：从未改变，只是更清晰

核心洞察

软件工程从来不是关于代码。

回到最初的问题，当被问及"你的工作产出是代码吗"时，很多人放下了手。

工程从来不只是写代码。 编程是极佳的能力和宝贵的财富，但并非最终目的。

工程是人类对问题的精准探索，是解决人类问题的软件方案。

范式转变

历来如此，我们只是逐渐从：

❌ 为不同的机器编码（汇编、C、Java、Python）
✅ 统一成人类实际解决问题的编码方式（规范、意图、价值观）

我们正在摆脱"适应机器"的束缚，转向"表达人类意图"的自由。

新的稀缺技能

向前看，新的稀缺技能是编写完整体现意图与价值观的规范。

掌握这一点的人将成为最有价值的程序员。

很可能这将成为今天的程序员——这已经和我们所做的非常相似。

但不仅如此：

产品经理也编写规范
立法者撰写法律规范
这其实是一条普遍原则

规范让你更快更安全地交付。人人皆可参与。无论谁撰写规范，无论是产品经理、立法者、工程师还是营销人员，都是程序员。

八、行动指南：立即开始

立即行动

开发下一个 AI 功能时，从规范开始：

明确期望：你期望达成什么？
定义成功：成功的标准是什么？
讨论澄清：是否真正明确写出并传达清楚？
让规范可执行：将规范输入模型
测试验证：根据规范测试模型或代码

开放性问题

这个领域有许多有趣的问题等待探索：

1. 未来的 IDE 是什么样？

我认为这是一种集成思维梳理器（Integrated Deliberation Environment）：

当你编写规范时，它能消除模糊之处
要求你澄清，从而真正明确你的想法
让你与所有人能更有效地相互传达意图

2. 如何大规模协调智能体？

这正是既可行又亟需的——通过规范大规模地协调智能体。

3. 如何确保真正理解？

"直到你突然意识到，你从未告诉它你想要什么，或许你根本就没完全理解过它。"

这是对明确规范的呼吁。

结论：新代码时代已经到来

核心要点总结

价值重估：代码只占工作价值的 10-20%，真正的价值在于结构化沟通
规范优先：规范比代码更强大，因为它包含完整的意图和价值观
可执行文档：规范不仅是文档，更是可执行、可测试、可迭代的"源代码"
普遍原则：从程序员到立法者，所有人都在制定规范
范式转变：从"为机器编码"到"为人类意图编码"

新的稀缺技能

未来最有价值的程序员，将是那些能够：

最清晰地表达意图和价值观
最有效地进行结构化沟通
编写完整体现目标的规范

的人。

最终呼吁

Sean Grove 和 OpenAI 新成立的代理鲁棒性团队发出呼吁：

加入我们，共同实现安全的通用人工智能，造福全人类。

因为在这个新代码时代，我们需要的不仅是会写代码的人，更需要能够清晰表达人类意图、协调智能体、确保 AI 安全对齐的规范制定者。

延伸思考

对个人的启示

重新评估你的技能组合：沟通能力比编码能力更重要
开始练习编写清晰的规范和意图文档
学会使用规范驱动开发（Specification-Driven Development）

对团队的启示

建立规范优先的文化
投资于规范工具链（类型检查、Linter、测试）
让所有角色（产品、工程、法律、安全）共同参与规范制定

对行业的启示

开发新的 IDE 和工具，支持规范驱动开发
建立规范的标准和最佳实践
探索规范的可组合性和模块化

新代码时代已经到来。问题不是"是否会到来"，而是"你准备好了吗？"

如果这篇文章对你有帮助，欢迎点赞、收藏、转发。也欢迎在评论区分享你的经验，我们一起交流学习！

我是 dtsola【IT解决方案架构师 | AI创业者】；专注AI创业、商业、技术、心理学、哲学内容分享。

提供服务：AI项目咨询 | 技术解决方案 | IT项目实施 | 企业技术顾问

博客：https://www.dtsola.com

公众号&VX：dtsola

需提供服务，加微信 dtsola，备注：IT咨询，并说明来意。

#AI编程 #VibeCoding #AI产品 #ClaudeCode #独立开发者 #AI创业 #一人公司 #程序员 #软件工程师 #软件工程

引言：重新审视程序员的价值

一、被忽视的 80%：结构化沟通的真正价值

程序员的真实工作流程

瓶颈在哪里？

氛围编程的启示

二、规范：比代码更强大的产物

什么是规范？

为什么规范优于代码？

一个思想实验

三、OpenAI 模型规范：规范的实践案例

模型规范是什么？

Markdown 的优势

规范的结构

案例：谄媚问题（Sycophancy）

规范作为信任锚点

四、深思对齐：让规范可执行

技术原理

技术优势

应用场景

五、规范即代码：新的编程范式

规范与代码的相似性

规范的工具链

1. 类型检查（Type Checking）

2. Linter

3. 单元测试

4. 版本控制

六、立法者即程序员：普遍适用的原则

美国宪法：国家级模型规范

普遍的规范制定者

七、软件工程的本质：从未改变，只是更清晰

核心洞察

范式转变

新的稀缺技能

八、行动指南：立即开始

立即行动

开放性问题

1. 未来的 IDE 是什么样？

2. 如何大规模协调智能体？

3. 如何确保真正理解？

结论：新代码时代已经到来

核心要点总结

新的稀缺技能

最终呼吁

延伸思考

对个人的启示

对团队的启示

对行业的启示

【AI创业】一个人，一小时，改写硅谷规则：Moltbot创始人的退休复出传奇

【AI编程】AI生成的代码你敢用吗？

dtsola