
配套视频:https://www.bilibili.com/video/BV1GnBrBeEqr/
引言:从智能体到技能的范式转变
"智能体虽有能力和智力,却未必具备实际工作所需的专长。"
这是 Anthropic 工程师 Barry Zhang 和 Mahesh Murag 在最新演讲中提出的核心观察。如今,许多人每天都在使用智能体,但仍然发现它们存在明显不足。尽管智能体拥有强大的能力和智力,却往往缺乏实际工作所需的专业技能。
正是基于这一洞察,Anthropic 团队做出了一个大胆的决定:停止构建智能体,转而专注于技能(Skills)开发。这不仅是技术路线的调整,更代表着对 AI 智能体未来发展方向的深刻思考。
智能体生态的快速演进
技术环境的巨大变化
自上次演讲以来,AI 智能体领域发生了翻天覆地的变化。MCP(Model Context Protocol)已成为智能体连接的行业标准,首款 Claude Code 编程智能体正式发布,Claude 智能体 SDK 也已开箱即用,提供可投入生产的成熟智能体。
整个生态系统正变得越来越成熟,并迈向智能体的新范式——模型与运行环境的深度融合。
"只需代码即可"的新理念
过去,团队认为不同领域的智能体会有很大差异,每个领域都需要专属的工具和架构。但在构建实践中,他们发现了一个重要事实:底层的智能体实际上比想象的更通用。
关键的转折点出现在构建 Claude Code 之后。团队意识到,代码不仅是一个应用场景,更是通往数字世界的通用接口。Claude Code 本质上就是一个通用智能体。
以生成财务报告为例:
模型可以调用 API 获取数据并进行分析
能在文件系统中整理这些数据
能用 Python 分析数据
通过代码将洞察合成为各种文件格式
核心框架可能突然变得像 bash 和文件系统一样简洁,这很好且极具扩展性。但很快,他们遇到了另一个更深层的问题。
专业能力的困境:智商不等于专长
一个生动的类比
Barry 提出了一个发人深省的问题:"你希望谁来报税?是 Mahesh,那个 300 智商的数学天才吗?还是 Barry,一位经验丰富的税务专家?"
Mahesh 自己的回答是:"我每次都选 Barry。我可不想让 Mahesh 从基本原理搞明白那 20 到 25 条税法。我需要领域专家稳定执行。"
如今的智能体很像 Mahesh——他们很出色,却缺乏专长。
当前智能体的三大局限
关键的背景信息往往缺失
智能体缺乏对特定领域的深入理解和上下文认知难以充分吸收专业知识
即使提供了大量信息,智能体也很难像人类专家那样内化这些知识不会随时间学习进化
传统智能体缺乏持续学习和改进的机制
这些问题的根源在于:智能体需要的不仅是通用能力,更需要可执行的程序性知识。
技能(Skills):为智能体注入专业能力
核心定义:技能就是文件夹
Anthropic 团队创造了"智能体技能"这一概念。技能是文件的有序集合,为智能体组合了可执行的程序性知识。
换句话说,它们就是文件夹——这种简洁是刻意为之。
团队希望无论人还是智能体,只要有一台电脑就能创建和使用技能。这意味着:
能与现有工具兼容
支持用 Git 管理版本
可以扔进 Google Drive
打包成压缩文件分享给团队
我们数十年来一直用文件作为基础,而且习惯如此,为何现在要改?
从工具到脚本:代码的优势
技能可以包含大量脚本作为工具。相比传统工具,代码具有明显优势:
传统工具的问题:
指令编写不佳,相当模糊不清
当模型遇到困难时,无法对工具做出有效调整
始终存在于上下文窗口中,占用宝贵资源
代码作为工具的优势:
代码自带说明,更易理解
可修改和调整,适应具体需求
可存于文件系统,直到真正需要并使用时才加载
实际案例:幻灯片样式脚本
团队反复看到 Claude 编写相同的 Python 脚本,一遍又一遍地为幻灯片添加样式。于是他们让 Claude 保存这个脚本作为技能,未来只需运行脚本,就能使一切更加一致和高效。
运行时逐步披露机制
技能可以包含大量信息,但为了保护上下文窗口,技能采用运行时逐步披露的机制:
元数据阶段:仅向模型表明其具备此技能
激活阶段:当智能体需要使用技能时,读取 skill.md 的完整内容
执行阶段:访问核心指令、目录和其余文件夹内容
这样可以容纳数百项技能,真正实现可组合性。
蓬勃发展的技能生态系统
五周内的爆发式增长
自五周前发布以来,这一简单设计已迅速转化为一个快速发展的生态系统,产生了数千项技能。
技能主要分为三大类型:
1. 基础技能:赋予新能力
基础技能为智能体提供之前所不具备的通用能力或特定领域能力。
Anthropic 官方案例:
文档处理能力:让 Claude 具备创建和编辑专业级办公文档的能力
生态合作伙伴案例:
Cadence 科研技能:提升 Claude 的科研能力,包括电子健康记录分析及更熟练使用常见 Python 生物信息学库
2. 第三方技能:深度集成
生态合作伙伴开发技能,帮助 Claude 更好地整合其软件和产品。
Browserbase 的 Stagehand 技能:
为开源浏览器自动化工具 Stagehand 开发技能
Claude 通过这项技能可以上网并更高效地使用浏览器完成工作
Notion 集成技能:
推出多项技能,帮助 Claude 更好地理解用户的 Notion 工作区
对整个工作区进行深度研究
3. 企业定制技能:组织的核心竞争力
这是技能最受关注和取得进展的领域。这些是为企业和团队量身定制的专属技能。
财富 100 强企业的应用:
利用技能培训智能体掌握组织最佳实践
教会智能体使用定制的内部软件
传授独特的工作方式和流程
大型开发者效率团队:
为数千甚至数万名开发者提供服务
通过技能部署 Claude Code 等智能体
传授代码风格的最佳实践
让开发人员在内部协作,掌握代码风格规范等所需技能
技能生态的三大发展趋势
趋势一:技能日益复杂化
如今最基础的技能依然可以是一个包含提示和一些基础指令的 skill.md Markdown 文件。
但团队开始看到打包完整软件的技能,包含:
可执行文件和二进制文件
代码脚本
资源文件
大量配置
许多技能的构建可能只需几分钟或几小时,但越来越多的技能如同我们今天使用的软件,构建可能需要数周甚至数月,并需要持续维护。
趋势二:与 MCP 生态系统融合
技能生态系统正与现有 MCP 服务器生态系统深度融合。
开发者正在构建能够编排多个 MCP 工具工作流的技能,通过外部数据与连接协同完成更复杂的任务。
MCP 连接外部世界,技能提供专业能力。 两者相辅相成,共同构建更强大的智能体。
趋势三:非技术人员开始构建技能
这是最令人兴奋的趋势。团队看到一些技能正由非技术人员构建,这些人来自:
财务部门
招聘团队
会计岗位
法务团队
这充分验证了设计理念:技能能帮助那些不具备编码能力的人扩展通用智能体,使其更胜任日常任务。
通用智能体的新兴架构
架构的四大组成部分
Anthropic 认为,通用智能体的新兴架构包含以下几个关键部分:
1. 智能体循环(Agent Loop)
管理模型的内部上下文
控制输入和输出的令牌
2. 运行时环境(Runtime)
提供文件系统
赋予智能体读写代码的能力
3. MCP 服务器
连接工具和外部数据
让智能体更实用和高效
4. 技能库(Skills Library)
可为同一智能体提供数百甚至数千项技能
仅在运行时根据需要调用
按需为智能体配备相应能力
实际部署:金融与生命科学领域
上线技能五周后,Anthropic 随即推出了金融和生命科学领域的新服务。
每个领域均配备:
一组 MCP 服务器
相关的技能集合
这种模式能迅速提升 Claude 在各领域的专业效能。
处理特定任务时,新领域的新能力可能只需赋予智能体合适的一组 MCP 服务器及配套技能库。
未来发展:待解决的问题
软件化管理
随着技能日益复杂,团队需要支持开发者、企业及其他技能开发者像对待软件一样对待技能。
这意味着探索:
测试与评估:确保智能体在合适的时间加载并触发技能
输出质量评估:评估技能加持下智能体的输出质量
一致性保障:确保与智能体应有的执行水平一致
版本管理
随着技能及其对应智能体行为的发展,团队希望这一过程能被清晰追踪,并明确追踪其历史脉络。
依赖关系管理
团队还想探索技能可以明确依赖或引用:
其他技能
MCP 服务器
智能体环境中的包和依赖项
这将使智能体:
在不同运行环境中更具可预测性
更高效地运行
支持多种技能的组合
引出更复杂、更相关的行为
共享知识库:最激动人心的愿景
集体演进的能力库
Barry 和 Mahesh 经常思考企业未来大规模部署智能体的方向。最让他们兴奋的愿景是:
一个集体共享且持续演进的知识库,由人员和智能体共同维护的能力库。
技能如何实现这一愿景
技能为智能体提供执行任务的程序性知识,让它做有用的事。当用户与智能体交互并提供反馈及更多机构知识时,情况开始好转——所有智能体在团队和组织内部也会随之提升。
当有人加入团队并首次使用 Claude 时,它已经知晓:
你团队关心的事
你的日常工作
如何高效完成你的工作
复合价值的社区效应
随着生态系统不断壮大,这种复合价值将延伸至更广泛的社区,超越单个组织:
世界上其他人构建的 MCP 服务器,让你的智能体更有用
社区中他人构建的技能,能让你的智能体更强大、更可靠、更有用
Claude 的持续学习
这一不断演进的知识库愿景,当 Claude 开始构建这些技能时将变得更强大。
团队专门将技能设计为持续学习的具体步骤:
标准化格式的保障:
Claude 记录的内容皆可高效利用
由其未来版本实现
使学习真正具备可迁移性
技能使记忆概念更具体:
它们无法捕捉全部信息类型
但能捕捉 Claude 可用于特定任务的程序性知识
灵活性的重要性:
Claude 能即时获取新能力
按需演进
然后淘汰过时的能力
团队的目标是:与你合作 30 天后,Claude 将比第一天更好。 从第一天起,Claude 就能通过技能创建器为你生成技能,并将持续朝这个方向推进。
计算领域的类比:从处理器到应用
三层架构的映射
Barry 通过类比计算领域的发展,来阐释智能体架构的演进:
模型 = 处理器
均需巨额投入
包含巨大潜力
但单用作用有限
智能体运行时 = 操作系统
协调处理器周围的进程、资源与数据
提供最简洁高效、最可扩展的抽象
获取正确的令牌进出模型
技能 = 应用软件
这里才是真正的价值所在
开发者的创造力空间
少数公司生产处理器和操作系统,但像我们这样的开发者有数百万。我们已经构建了融入领域专长和独特视角的软件。
技能希望帮助每个人打开这一层——在这里,我们发挥创意,为自己、为彼此、也为世界解决实际问题。
只需把东西放进文件夹,技能只是起点。
结论:行动的号召
综上所述,Anthropic 团队认为:
通用智能体的通用架构正在形成
由智能体循环、运行时、MCP 服务器和技能库组成技能是发布和共享新功能的全新范式
简单、强大、可扩展是时候停止重复开发智能体,转而专注构建技能了
这是更高效、更可持续的发展路径
正如 Barry 和 Mahesh 在演讲结尾所说:
"如果你对此感兴趣,欢迎加入我们,今天就开始打造技能。"
#AI编程 #VibeCoding #智能体 #ClaudeCode #独立开发者 #AI创业 #一人公司 #程序员 #软件工程师 #软件工程