来源: YouTube (AI Engineer) | Justin Schroeder | Jun 28, 2026 播客: AI Engineer 分类: 其他 原文发表: Jun 28, 2026 纪要生成: 2026-06-29
Justin Schroeder 是一家处于隐身模式的初创公司 Standard Agents 的成员,也是多个知名开源项目(如 Dmux、ArrowJS)的作者。他在本演讲中系统阐述了为何领域特定代理将在AI未来扮演重要角色。他通过类比工业革命、软件开发原则以及阿波罗登月计划,批判了当前主流通过 MCP 和技能堆砌来增强通用代理的做法,并提出了一种高度模块化、高效、安全且经济的代理构建新范式。
本节重点
详细精要
ArrowJS:类似 React 的 UI 框架,专为代理时代设计。
时代类比:
工业革命的关键催化剂是 “用机器驾驭能源”,而当前AI时代的催化剂则是 “用代理驾驭智能”。
代理(Agent)的定义模糊性:
💬 精华片段(中文)
“代理是确定性的软件,它利用模型产生的非确定性结果来追求某个预期目标。”
"Agents are deterministic software that harness the non-deterministic results produced by models in pursuit of some desired objective."
本节重点
详细精要
然而,从街边的房地产中介、独立的保险经纪人到 财富500强 公司,所有人都在尝试构建自己的自定义代理。
根本原因:集成(Integration)的需求:
构建自定义代理是他们发现的首要解决方案。
构建代理的现实困难:
💬 精华片段(中文)
“构建健壮的代理就是很难。如果你去找任何IT部门的人聊,他们正在为此抓狂,因为有太多不同的关注点。”
"Building robust agents is just hard. And if you go talk to anybody in an IT department, they are pulling their hair out because there are so many different concerns."
本节重点
详细精要
在构建代理短暂受挫后,人们转向 模型上下文协议(Model Context Protocol, MCP),希望借此将公司信息(如 Zillow 的数据)注入到 Claude 或 ChatGPT 等大型通用代理中。
MCP 的实际作用:
MCP 实际上已成为代理的事实工具分发机制。如果企业需要将自己的工具接入其它代理,MCP 是一个好方法,但它尚未证明能提供其他方面的价值。
工具和技能的类比批评:
💬 精华片段(中文)
“我们经常开玩笑说,我们可没有靠给一个人一大堆工具就成功把人送上月球。这不是完成一个超大型项目的现实方法。”
"I like to joke that we didn't land a man on the moon by giving one guy a ton of tools. That's not a realistic way to get a really large project done."
本节重点
详细精要
几乎所有这些层最终都变成了模型的上下文(Context),人们解决集成问题的努力都集中在上下文和模型这两个领域。
继承(Inheritance)模式的困境:
继承模式有效但受限:少量技能(如5个)运行良好,但当数量增至100个、1000个时,必然会在某个点达到收益递减,因为上下文变得过于臃肿。
组合(Composition)模式的提出:
工作示例:主代理需要安排旅行,它会用英语向 Gmail 代理询问相关邮件,将结果传回,然后再用英语告知 Travel 代理进行预订。
登月计划的类比:
💬 精华片段(中文)
“在工程领域有一个术语:‘继承’。继承的原理是,你拿一个对象,然后不断给它添加更多属性……关于继承的事实是,它确实有效。但有一句老话:‘组合优于继承’。”
"We have a term for this in engineering. It's called inheritance... And the truth about inheritance is it works... But, there's an old saying, 'Composition over inheritance'."
本节重点
详细精要
Justin 将这类代理命名为领域特定代理,并透露其公司 Standard Agents 已经在这个生态系统中深耕了一段时间,虽然尚未公开发布产品。
优势一:极高的Token效率:
原因:当协调器向某个代理(如Gmail代理)下达任务时,该代理接收到的上下文极其精简,只有其系统消息、关键工具和一条来自协调器的消息,完全没有无关的对话历史。
优势二:与小型语言模型结合,实现巨大成本节约:
关键:小型模型可能在通用任务上反复失败,导致实际成本更高。但在领域特定代理中,模型只需在极简上下文中执行被专门挑选的、特定的任务,可以非常忠实地执行,从而在享受小型模型低成本的同时保证任务成功率。
优势三:可强制执行严格的能力限制,提升安全性:
当向企业IT人员(如"Doug")解释时,这种区别能让他们安心。
优势四:卓越的可扩展性:
它们不需要像大型单体应用那样需要巨型VPC,可以在全球不同地区同时运行数千个实例,无需地理上的共置。
当前状态的遗憾:
💬 精华片段(中文)
“像 DeepSeek V4 Flash 和 Fable 5 这两个模型之间的成本差距令人震惊。它每次任务比 Fable 便宜 137 倍。137倍!”
"If you look at the difference in two models like DeepSeek V4 Flash and Fable 5, the cost difference is mind-boggling. It is 137 times cheaper than Fable per task. 137 and 37 times."
本节重点
详细精要
近日 Vercel 发布 Eve 框架,其官方描述中就明确包含了"domain-specific agent",印证了他的预测正在变为现实。
Token成本上升的逆趋势:
这意味着,为大型企业寻找降低Token成本的方法变得至关重要。
面向客户场景的商业需求:
必须在保证高效能的同时实现高效率,而领域特定代理是实现这一目标的途径。
理想代理的完整构成要素:
必须的原语:
递归子代理编排的蓝图:
💬 精华片段(中文)
“这就是领域特定代理背后的理念。你可以拥有各种各样高效的小型代理协同工作,但全程都维持着最小化的上下文窗口。”
"That's the idea behind domain-specific agents. You can end up with all kinds of highly efficient, small little agents that are all working together, but maintaining small minimal context windows all the way through."
| 术语 | 解释 |
|---|---|
| Domain-Specific Agent | 领域特定代理。Justin Schroeder 提出的核心理念,指针对特定垂直领域(如Figma、Gmail、Salesforce)构建的小型、独立、高效的AI代理。 |
| Agent / Harness | 代理/束缚具。在演讲中,Justin认为这两个词的区别过于学究,可以互换使用,均指利用模型非确定性结果来完成任务的确定性软件系统。 |
| Model Context Protocol (MCP) | 模型上下文协议。最初旨在提供通用集成方案,但现实中已主要沦为代理的工具分发机制。 |
| Inheritance / Composition | 继承 / 组合。源自面向对象编程的设计原则。Justin 用来类比构建代理的两种方式:继承是堆叠技能和工具来增强一个代理,组合是用多个独立专精的代理协同工作。 |
| Agentic Loop | 代理循环。代理执行任务时的核心编排逻辑,包括思考、调用工具、观察结果、再思考的循环过程。 |
| Durable Execution | 持久化执行。一种软件工程保证,确保程序在发生故障后,能够从断点准确恢复执行,不丢失状态,对生产级代理至关重要。 |
| Telemetry & Observability | 遥测与可观测性。指对代理运行的每一步、每一轮进行数据采集和监控的能力,是诊断、调试和优化代理的基础。 |
| Skills | 技能。特指在代理语境下,作为一种向代理提供知识的 Markdown 文档。研究发现,过多技能会损害代理性能。 |
| Hooks | 钩子。理想代理架构的一个组件,用于在运行时改变上下文或触发副作用,如为没有时间感知能力的LLM注入当前时间。 |
| Token Efficiency | Token效率。衡量代理执行任务时消耗Token数量的指标。领域特定代理通过精简上下文,在此指标上远超通用代理。 |
| Multi-Agent Orchestration | 多代理编排。指对多个独立、专业化的AI代理进行协调和管理,使其作为一个整体协同完成复杂任务。 |