▶ 原文链接
别构建Agent,转而建设技能——Anthropic Barry Zhang与Mahesh Murag分享
来源: Youtube | Barry Zhang、Mahesh Murag | 2025-12-08
分类: Anthropic
原文发表: Dec 08, 2025
纪要生成: 2026-02-25
全集重点
- 核心范式转变:Anthropic提出放弃定制各领域Agent,转向通用Agent+可组合技能的新架构,大幅降低落地成本
- 技能核心价值:技能是打包领域程序性知识的文件夹集合,解决通用Agent缺乏专业知识、输出不稳定的痛点
- 生态落地进展:发布仅5周已形成数千个技能的生态,覆盖基础能力、第三方工具适配、企业定制三大类
- 长期愿景规划:将推动技能的全生命周期管理体系建设,实现企业与社区的知识共享、Agent持续学习
嘉宾/话题简介
本次分享嘉宾为Anthropic的核心研发人员Barry Zhang与Mahesh Murag,二人主导了Anthropic Agent技能体系的设计与落地。本次分享聚焦当前Agent规模化落地的核心痛点,提出“放弃定制各领域Agent、转向建设通用技能生态”的全新范式,详细讲解了技能的设计逻辑、生态进展与未来规划,为AI Agent的产业落地提供了可复用的架构方向。
分节详述
00:00 开场与Agent范式转变背景
本节重点
- 本次分享核心论点为放弃定制各领域Agent,转向建设通用Agent的技能生态
- 当前Agent已实现普及,但缺乏专业领域知识是落地的核心痛点
- 代码是数字世界的通用接口,通用Agent的底层架构具备高度统一性
详细精要
- Agent普及后的核心痛点:当前用户已普遍使用Agent,但Agent仅具备通用智能,缺乏真实工作所需的领域专业知识,落地效率低
- 距上次分享以来,MCP已成为Agent连接的行业标准,Anthropic推出的首款编码Agent Cloud Code 正式上线,云Agent SDK 已可提供开箱即用的生产级Agent
- 行业最初认为不同领域的Agent需要独立定制,各自搭配专属工具与脚手架,适配成本极高
- 代码是数字世界的通用接口:Anthropic研发过程中发现,代码并非单一使用场景,而是Agent连接所有数字能力的通用接口
- 以生成财务报告为例,Agent可通过代码调用API拉取数据、操作文件系统存储数据、运行Python完成分析、输出指定格式的报告,所有环节均通过代码实现
- 通用Agent的核心脚手架可简化至仅需bash与文件系统,具备极强的可扩展性
- 通用Agent的专业能力缺口:通用Agent类似高智商新手,具备极强的学习能力,但无法快速掌握领域专属规则,输出稳定性不足
- 举例而言,税务申报工作更适合有经验的税务专业人员完成,而非让高智商新手从零推导2025年的税务规则
- 现有通用Agent需要用户提供大量前置引导才能完成专业任务,无法直接吸收用户的专业知识,也无法实现能力的持续沉淀
💬 精华片段(中文)
"We used to think agents in different domains will look very different. Each one will need its own tools and scaffolding and that means we'll have a separate agent for each use case for each domain. Well, customization is still important for each domain. The agent underneath is actually more universal than we thought."
02:32 技能的定义与设计逻辑
本节重点
- 技能是打包领域程序性知识的文件夹集合,设计极简可被人和Agent共同创建使用
- 技能以代码脚本作为工具载体,解决传统工具文档模糊、不可修改、占用上下文窗口的问题
- 技能采用渐进披露机制,仅在需要时加载完整内容,可支持同时挂载数百个可组合技能
详细精要
- 技能的核心定义:技能是经过组织的文件集合,用于打包供Agent使用的可组合程序性知识,本质就是标准化的文件夹
- 该设计刻意保持极简,只要具备电脑的人或Agent都可以创建和使用,可兼容现有工具链,支持Git版本管理、存入Google Drive、打包分享给团队
- 技能沿用了已使用数十年的文件作为底层原语,无需用户学习新的交互规则
- 技能的工具优势:技能以代码脚本作为工具载体,解决了传统Agent工具的三大痛点
- 传统工具普遍存在说明文档不完善、语义模糊的问题,模型遇到问题时无法自行修改工具,容易陷入冷启动困境,且始终占用上下文窗口空间
- 代码脚本具备自解释、可修改的特性,仅在需要时从文件系统加载,不会占用不必要的上下文窗口资源
- 举例:团队发现Claude反复生成相同的Python脚本为幻灯片添加样式,于是要求Claude将该脚本存入技能作为未来使用的工具,大幅提升了后续同类任务的效率与一致性
- 渐进披露的加载机制:技能采用渐进式披露设计,仅在运行时向模型展示元数据,确认需要使用后才加载完整内容
- 该设计可支持Agent同时挂载数百个技能而不超出上下文窗口限制,实现技能的高度可组合性
- 元数据仅用于告知Agent具备某一技能,当Agent决定使用该技能时,才会读取包含核心说明与文件夹目录的 skill.md 文件,其余内容按需求访问
💬 精华片段(中文)
"Skills are organized collections of files that package composable procedural knowledge for agents. In other words, they're folders. This simplicity is deliberate. We want something that anyone human or agent can create and use as long as they have a computer."
05:09 技能生态的三类细分与落地案例
本节重点
- 技能发布仅5周已形成数千个规模的快速增长生态,分为基础技能、第三方技能、企业定制技能三类
- 基础技能为Claude补充通用或领域专属基础能力,第三方技能适配厂商产品能力,企业定制技能沉淀组织专属知识
- 非技术人员也可创建技能,大幅降低了Agent能力扩展的门槛
详细精要
- 三类技能的生态构成:发布仅 5周,技能生态已快速增长至数千个规模,主要分为三大类
- 第一类是基础技能:为Agent补充原本不具备的通用或领域专属能力,Anthropic官方推出了文档技能,可支持Claude创建编辑专业级办公文档;合作伙伴Cadence推出了科研技能,可支持Claude完成电子病历数据分析、熟练使用常用Python生物信息学库
- 第二类是第三方合作伙伴技能:由工具厂商推出,帮助Claude更好地适配自身产品,例如Browserbase为其开源浏览器自动化工具 Stage Hand 推出了专属技能,Claude挂载后可更高效地完成网页导航、浏览器操作;Notion推出了系列技能,帮助Claude理解用户的Notion工作空间,完成全工作空间的深度调研
- 第三类是企业内部定制技能:当前最受市场欢迎的技能类型,由企业或团队自行打造,沉淀组织专属知识
- 企业定制技能的落地场景:当前大量 财富100强 企业已开始使用技能体系,主要覆盖两大场景
- 用于向Agent传授组织最佳实践,以及企业自研内部软件的独特使用规则,解决通用Agent不熟悉企业内部流程的问题
- 大型开发者效能团队为服务内部数千甚至数万名开发者,将代码规范最佳实践等规则打包为技能,部署给Cloud Code等Agent,统一内部开发标准
- 技能的低门槛特性:技能的极简设计使得非技术人员也可完成创建,进一步扩展了Agent的适用范围
- 目前已有财务、招聘、会计、法律等非技术岗位的人员自行创建技能,用于扩展Agent的能力适配自身日常工作
- 这一现象验证了技能设计的初衷:无需编码能力也可扩展通用Agent的能力,降低Agent的使用门槛
💬 精华片段(中文)
"And I think where I've seen the most excitement and traction with skills is within large enterprises. These are company and team specific skills built for an organization."
07:40 技能生态发展趋势与Agent新架构
本节重点
- 技能正朝着复杂化方向发展,未来将类似软件产品需要长期开发维护
- 技能与MCP体系形成互补,MCP负责外部连接,技能负责专业知识沉淀
- 新的通用Agent架构已成型:Agent循环+运行时环境+MCP服务器+技能库
详细精要
- 技能生态的三大发展趋势:随着生态快速扩张,当前已出现三大明显趋势
- 技能复杂度持续提升:早期的技能仅需包含skill.md文件与简单提示词即可,当前已出现打包软件、可执行文件、二进制文件、代码、脚本、资产等多类型内容的复杂技能,部分技能的构建耗时已达数小时,未来将类似普通软件,需要数周甚至数月的开发与维护周期
- 技能与MCP生态形成互补:开发者开始使用技能编排多个MCP工具的工作流,完成更复杂的外部数据处理与连接任务,其中MCP负责提供与外部世界的连接能力,技能负责提供专业领域知识与流程逻辑
- 非技术人员成为技能创建的重要主体,进一步拓宽了技能的覆盖场景
- 通用Agent的新架构:当前行业已逐步收敛到统一的通用Agent架构,主要包含四大核心模块
- 第一模块是Agent循环:负责管理模型的内部上下文,控制输入输出的token流转
- 第二模块是运行时环境:为Agent提供文件系统与代码读写能力,是Agent运行的基础载体
- 第三模块是MCP服务器:为Agent提供外部工具与数据连接,扩展Agent的外部交互能力
- 第四模块是技能库:包含数百到数千个技能,Agent仅在处理特定任务需要时才将对应技能加载到上下文窗口
- 新架构的落地成果:该架构已在Anthropic内部落地,显著提升了Claude的垂直领域适配效率
- 技能发布5周后,Anthropic快速推出了金融服务、生命科学两大垂直领域的Claude解决方案,每个方案仅需搭配对应MCP服务器与专属技能,即可快速满足领域专业人员的使用需求
- 该架构摆脱了过去为每个垂直领域重新开发定制Agent的高成本模式,大幅缩短了垂直领域落地周期
💬 精华片段(中文)
"In these cases, MCP is providing the connection to the outside world while skills are providing the expertise."
10:50 技能的未来发展方向与长期愿景
本节重点
- 未来将把技能按软件标准管理,完善测试评估、版本管理、依赖管理三大体系
- 技能将成为企业内部与社区知识沉淀的核心载体,实现知识的共享与复利效应
- 技能是实现Agent持续学习的核心载体,未来Claude可自动创建更新技能,实现能力的持续进化
详细精要
- 技能的基础设施建设方向:未来Anthropic将围绕技能打造类似软件的全生命周期管理体系,重点建设三大能力
- 测试与评估体系:提供工具确保Agent在正确的时间、为正确的任务加载触发技能,同时可衡量挂载技能后Agent的输出质量,确保符合预期标准
- 版本管理体系:跟踪技能迭代过程中对应的Agent行为变化,保留清晰的演化谱系,方便企业回溯与管控Agent能力变化
- 依赖管理体系:支持技能明确声明依赖的其他技能、MCP服务器、环境依赖包,提升Agent在不同运行环境中的行为可预测性,强化多技能组合的兼容性
- 技能的共享生态愿景:技能的核心价值将来自于共享与分发,形成可复利增长的知识体系
- 企业内部可形成由员工与Agent共同维护的、持续进化的能力知识库,所有团队成员使用的Agent可共享组织沉淀的技能,新员工入职即可使用适配团队工作习惯的Agent,无需重新培训
- 生态层面可形成跨组织的技能共享社区,类似当前MCP服务器的共享模式,其他用户开发的技能可直接复用,提升所有Agent的能力上限
- 技能支撑Agent持续学习:技能的标准化设计是实现Agent持续学习的核心基础
- 技能的标准化格式确保Claude生成的内容可被未来版本的自己高效使用,实现学习成果的可迁移,将Agent的“记忆”转化为可落地的程序性知识
- 当前Claude已可通过“技能创建技能”自动生成新的技能,未来将持续强化这一能力,支持Claude自动获取新能力、迭代现有能力、淘汰过时能力,使用越久能力越强
- Agent栈的类比总结:团队将当前的Agent技术栈与传统计算栈做类比,明确各层的定位
- 大模型类似处理器,需要巨额投入、潜力巨大,但单独使用价值有限
- Agent运行时类似操作系统,负责编排进程、资源与数据,大幅提升模型的使用价值
- 技能类似应用软件,将由数百万开发者共同打造,沉淀各领域的专业知识与独特解决方案,是Agent价值落地的核心层
💬 精华片段(中文)
"We think we're now converging on this general architecture for general agents. We've created skills as a new paradigm for shipping and sharing new capabilities. So we think it's time to stop rebuilding agents and start building skills instead."
专业术语注释
| 术语 |
解释 |
| Agent(智能体) |
本集语境中指可自主完成复杂任务的大模型驱动程序,具备上下文管理、工具调用、逻辑规划等能力 |
| MCP |
已成为行业标准的Agent连接协议,用于实现Agent与外部工具、数据的互联互通 |
| Cloud Code |
Anthropic推出的首款编码Agent,可辅助开发者完成各类编程任务 |
| 云Agent SDK |
Anthropic提供的官方开发工具包,可快速搭建生产级可用的Agent |
| Stage Hand |
Browserbase推出的开源浏览器自动化工具,可支持Agent模拟人类操作浏览器完成网页相关任务 |
| skill.md |
技能的核心说明文件,包含技能的功能说明、使用规则与对应文件夹的目录结构 |
延伸思考
- 企业可优先梳理内部高频、标准化的工作流程,将组织最佳实践、内部系统使用规则等内容打包为专属技能,快速提升Claude等通用Agent的业务适配性,降低员工使用Agent的门槛
- 第三方SaaS厂商可参考Browserbase、Notion的落地路径,提前推出适配自身产品的官方技能,降低用户将Agent与自身工具集成的成本,提升产品的AI原生竞争力
- 技能的安全审计、权限管理将成为Agent规模化落地的核心需求,需重点防范恶意技能在共享生态中传播,引发数据泄露、违规操作等风险
- 技能的版本管理、依赖治理、测试评估相关工具属于尚未被充分覆盖的新赛道,未来随着技能生态的扩张将出现明确的市场需求,具备创业机会
- 非技术岗位的员工可尝试将自身日常工作的标准化流程打包为技能,提升个人使用Agent的效率,未来企业也可鼓励全员参与技能建设,沉淀组织数字资产
原文发表:Dec 08, 2025 · 纪要生成:2026-02-25