配套视频:https://www.bilibili.com/video/BV1GnBrBeEqr/

引言:从智能体到技能的范式转变

"智能体虽有能力和智力,却未必具备实际工作所需的专长。"

这是 Anthropic 工程师 Barry Zhang 和 Mahesh Murag 在最新演讲中提出的核心观察。如今,许多人每天都在使用智能体,但仍然发现它们存在明显不足。尽管智能体拥有强大的能力和智力,却往往缺乏实际工作所需的专业技能。

正是基于这一洞察,Anthropic 团队做出了一个大胆的决定:停止构建智能体,转而专注于技能(Skills)开发。这不仅是技术路线的调整,更代表着对 AI 智能体未来发展方向的深刻思考。

智能体生态的快速演进

技术环境的巨大变化

自上次演讲以来,AI 智能体领域发生了翻天覆地的变化。MCP(Model Context Protocol)已成为智能体连接的行业标准,首款 Claude Code 编程智能体正式发布,Claude 智能体 SDK 也已开箱即用,提供可投入生产的成熟智能体。

整个生态系统正变得越来越成熟,并迈向智能体的新范式——模型与运行环境的深度融合

"只需代码即可"的新理念

过去,团队认为不同领域的智能体会有很大差异,每个领域都需要专属的工具和架构。但在构建实践中,他们发现了一个重要事实:底层的智能体实际上比想象的更通用

关键的转折点出现在构建 Claude Code 之后。团队意识到,代码不仅是一个应用场景,更是通往数字世界的通用接口。Claude Code 本质上就是一个通用智能体。

以生成财务报告为例:

  • 模型可以调用 API 获取数据并进行分析

  • 能在文件系统中整理这些数据

  • 能用 Python 分析数据

  • 通过代码将洞察合成为各种文件格式

核心框架可能突然变得像 bash 和文件系统一样简洁,这很好且极具扩展性。但很快,他们遇到了另一个更深层的问题。

专业能力的困境:智商不等于专长

一个生动的类比

Barry 提出了一个发人深省的问题:"你希望谁来报税?是 Mahesh,那个 300 智商的数学天才吗?还是 Barry,一位经验丰富的税务专家?"

Mahesh 自己的回答是:"我每次都选 Barry。我可不想让 Mahesh 从基本原理搞明白那 20 到 25 条税法。我需要领域专家稳定执行。"

如今的智能体很像 Mahesh——他们很出色,却缺乏专长。

当前智能体的三大局限

  1. 关键的背景信息往往缺失
    智能体缺乏对特定领域的深入理解和上下文认知

  2. 难以充分吸收专业知识
    即使提供了大量信息,智能体也很难像人类专家那样内化这些知识

  3. 不会随时间学习进化
    传统智能体缺乏持续学习和改进的机制

这些问题的根源在于:智能体需要的不仅是通用能力,更需要可执行的程序性知识

技能(Skills):为智能体注入专业能力

核心定义:技能就是文件夹

Anthropic 团队创造了"智能体技能"这一概念。技能是文件的有序集合,为智能体组合了可执行的程序性知识。

换句话说,它们就是文件夹——这种简洁是刻意为之。

团队希望无论人还是智能体,只要有一台电脑就能创建和使用技能。这意味着:

  • 能与现有工具兼容

  • 支持用 Git 管理版本

  • 可以扔进 Google Drive

  • 打包成压缩文件分享给团队

我们数十年来一直用文件作为基础,而且习惯如此,为何现在要改?

从工具到脚本:代码的优势

技能可以包含大量脚本作为工具。相比传统工具,代码具有明显优势:

传统工具的问题:

  • 指令编写不佳,相当模糊不清

  • 当模型遇到困难时,无法对工具做出有效调整

  • 始终存在于上下文窗口中,占用宝贵资源

代码作为工具的优势:

  • 代码自带说明,更易理解

  • 可修改和调整,适应具体需求

  • 可存于文件系统,直到真正需要并使用时才加载

实际案例:幻灯片样式脚本

团队反复看到 Claude 编写相同的 Python 脚本,一遍又一遍地为幻灯片添加样式。于是他们让 Claude 保存这个脚本作为技能,未来只需运行脚本,就能使一切更加一致和高效。

运行时逐步披露机制

技能可以包含大量信息,但为了保护上下文窗口,技能采用运行时逐步披露的机制:

  1. 元数据阶段:仅向模型表明其具备此技能

  2. 激活阶段:当智能体需要使用技能时,读取 skill.md 的完整内容

  3. 执行阶段:访问核心指令、目录和其余文件夹内容

这样可以容纳数百项技能,真正实现可组合性。

蓬勃发展的技能生态系统

五周内的爆发式增长

自五周前发布以来,这一简单设计已迅速转化为一个快速发展的生态系统,产生了数千项技能

技能主要分为三大类型:

1. 基础技能:赋予新能力

基础技能为智能体提供之前所不具备的通用能力或特定领域能力。

Anthropic 官方案例:

  • 文档处理能力:让 Claude 具备创建和编辑专业级办公文档的能力

生态合作伙伴案例:

  • Cadence 科研技能:提升 Claude 的科研能力,包括电子健康记录分析及更熟练使用常见 Python 生物信息学库

2. 第三方技能:深度集成

生态合作伙伴开发技能,帮助 Claude 更好地整合其软件和产品。

Browserbase 的 Stagehand 技能:

  • 为开源浏览器自动化工具 Stagehand 开发技能

  • Claude 通过这项技能可以上网并更高效地使用浏览器完成工作

Notion 集成技能:

  • 推出多项技能,帮助 Claude 更好地理解用户的 Notion 工作区

  • 对整个工作区进行深度研究

3. 企业定制技能:组织的核心竞争力

这是技能最受关注和取得进展的领域。这些是为企业和团队量身定制的专属技能。

财富 100 强企业的应用:

  • 利用技能培训智能体掌握组织最佳实践

  • 教会智能体使用定制的内部软件

  • 传授独特的工作方式和流程

大型开发者效率团队:

  • 为数千甚至数万名开发者提供服务

  • 通过技能部署 Claude Code 等智能体

  • 传授代码风格的最佳实践

  • 让开发人员在内部协作,掌握代码风格规范等所需技能

技能生态的三大发展趋势

趋势一:技能日益复杂化

如今最基础的技能依然可以是一个包含提示和一些基础指令的 skill.md Markdown 文件。

但团队开始看到打包完整软件的技能,包含:

  • 可执行文件和二进制文件

  • 代码脚本

  • 资源文件

  • 大量配置

许多技能的构建可能只需几分钟或几小时,但越来越多的技能如同我们今天使用的软件,构建可能需要数周甚至数月,并需要持续维护

趋势二:与 MCP 生态系统融合

技能生态系统正与现有 MCP 服务器生态系统深度融合。

开发者正在构建能够编排多个 MCP 工具工作流的技能,通过外部数据与连接协同完成更复杂的任务。

MCP 连接外部世界,技能提供专业能力。 两者相辅相成,共同构建更强大的智能体。

趋势三:非技术人员开始构建技能

这是最令人兴奋的趋势。团队看到一些技能正由非技术人员构建,这些人来自:

  • 财务部门

  • 招聘团队

  • 会计岗位

  • 法务团队

这充分验证了设计理念:技能能帮助那些不具备编码能力的人扩展通用智能体,使其更胜任日常任务。

通用智能体的新兴架构

架构的四大组成部分

Anthropic 认为,通用智能体的新兴架构包含以下几个关键部分:

1. 智能体循环(Agent Loop)

  • 管理模型的内部上下文

  • 控制输入和输出的令牌

2. 运行时环境(Runtime)

  • 提供文件系统

  • 赋予智能体读写代码的能力

3. MCP 服务器

  • 连接工具和外部数据

  • 让智能体更实用和高效

4. 技能库(Skills Library)

  • 可为同一智能体提供数百甚至数千项技能

  • 仅在运行时根据需要调用

  • 按需为智能体配备相应能力

实际部署:金融与生命科学领域

上线技能五周后,Anthropic 随即推出了金融和生命科学领域的新服务。

每个领域均配备:

  • 一组 MCP 服务器

  • 相关的技能集合

这种模式能迅速提升 Claude 在各领域的专业效能

处理特定任务时,新领域的新能力可能只需赋予智能体合适的一组 MCP 服务器及配套技能库。

未来发展:待解决的问题

软件化管理

随着技能日益复杂,团队需要支持开发者、企业及其他技能开发者像对待软件一样对待技能

这意味着探索:

  • 测试与评估:确保智能体在合适的时间加载并触发技能

  • 输出质量评估:评估技能加持下智能体的输出质量

  • 一致性保障:确保与智能体应有的执行水平一致

版本管理

随着技能及其对应智能体行为的发展,团队希望这一过程能被清晰追踪,并明确追踪其历史脉络。

依赖关系管理

团队还想探索技能可以明确依赖或引用:

  • 其他技能

  • MCP 服务器

  • 智能体环境中的包和依赖项

这将使智能体:

  • 在不同运行环境中更具可预测性

  • 更高效地运行

  • 支持多种技能的组合

  • 引出更复杂、更相关的行为

共享知识库:最激动人心的愿景

集体演进的能力库

Barry 和 Mahesh 经常思考企业未来大规模部署智能体的方向。最让他们兴奋的愿景是:

一个集体共享且持续演进的知识库,由人员和智能体共同维护的能力库。

技能如何实现这一愿景

技能为智能体提供执行任务的程序性知识,让它做有用的事。当用户与智能体交互并提供反馈及更多机构知识时,情况开始好转——所有智能体在团队和组织内部也会随之提升

当有人加入团队并首次使用 Claude 时,它已经知晓:

  • 你团队关心的事

  • 你的日常工作

  • 如何高效完成你的工作

复合价值的社区效应

随着生态系统不断壮大,这种复合价值将延伸至更广泛的社区,超越单个组织:

  • 世界上其他人构建的 MCP 服务器,让你的智能体更有用

  • 社区中他人构建的技能,能让你的智能体更强大、更可靠、更有用

Claude 的持续学习

这一不断演进的知识库愿景,当 Claude 开始构建这些技能时将变得更强大。

团队专门将技能设计为持续学习的具体步骤

标准化格式的保障:

  • Claude 记录的内容皆可高效利用

  • 由其未来版本实现

  • 使学习真正具备可迁移性

技能使记忆概念更具体:

  • 它们无法捕捉全部信息类型

  • 但能捕捉 Claude 可用于特定任务的程序性知识

灵活性的重要性:

  • Claude 能即时获取新能力

  • 按需演进

  • 然后淘汰过时的能力

团队的目标是:与你合作 30 天后,Claude 将比第一天更好。 从第一天起,Claude 就能通过技能创建器为你生成技能,并将持续朝这个方向推进。

计算领域的类比:从处理器到应用

三层架构的映射

Barry 通过类比计算领域的发展,来阐释智能体架构的演进:

模型 = 处理器

  • 均需巨额投入

  • 包含巨大潜力

  • 但单用作用有限

智能体运行时 = 操作系统

  • 协调处理器周围的进程、资源与数据

  • 提供最简洁高效、最可扩展的抽象

  • 获取正确的令牌进出模型

技能 = 应用软件

  • 这里才是真正的价值所在

开发者的创造力空间

少数公司生产处理器和操作系统,但像我们这样的开发者有数百万。我们已经构建了融入领域专长和独特视角的软件。

技能希望帮助每个人打开这一层——在这里,我们发挥创意,为自己、为彼此、也为世界解决实际问题。

只需把东西放进文件夹,技能只是起点。

结论:行动的号召

综上所述,Anthropic 团队认为:

  1. 通用智能体的通用架构正在形成
    由智能体循环、运行时、MCP 服务器和技能库组成

  2. 技能是发布和共享新功能的全新范式
    简单、强大、可扩展

  3. 是时候停止重复开发智能体,转而专注构建技能了
    这是更高效、更可持续的发展路径

正如 Barry 和 Mahesh 在演讲结尾所说:

"如果你对此感兴趣,欢迎加入我们,今天就开始打造技能。"


#AI编程 #VibeCoding #智能体 #ClaudeCode #独立开发者 #AI创业 #一人公司 #程序员 #软件工程师 #软件工程


Work Less, Earn More, Enjoy Life.