▶ 原文链接
《Claude Code背后的开发工程师揭秘其核心秘密》
来源: YouTube | Cat & Boris(Claude Code核心开发负责人) | 2025-10-29
分类: Anthropic
原文发表: Oct 29, 2025
纪要生成: 2026-02-25
全集重点
- 终端原生架构:放弃传统IDE侧边AI模式,直接打通终端全权限,实现工程师与模型双向对等操作
- 内部自测试驱动迭代:Anthropic超70%技术员工日常使用Claude Code,新功能先内部验证再上线,反馈效率极高
- 通用代理SDK转型:从专属编码工具拓展为通用Agent框架,已覆盖非编码场景如行政、市场调研、财务管理等
- 迭代优先级逻辑:优先适配最新最强模型能力,随时可淘汰过时脚手架功能,不惧怕短期废弃代码
- 潜在需求产品方法:优先开放扩展接口观察用户非预期用法,再将高频需求产品化,避免凭空猜测需求
嘉宾/话题简介
Cat和Boris是Anthropic旗下AI编码工具Claude Code的核心开发负责人,Boris主导技术方向与产品愿景,Cat负责商业化、发布流程与客户对接。本次访谈二人首次公开Claude Code从内部原型到行业标杆的开发历程,分享终端原生AI编码范式的设计哲学、企业落地实践,以及Anthropic内部基于AI的全新工程文化。访谈覆盖了Claude Code的核心功能设计、团队协作机制、未来产品规划等开发者普遍关注的问题。
分节详述
[00:00] 开场:Claude Code核心设计理念溯源
本节重点
- Claude Code核心优势是具备终端全操作权限,与工程师操作范围完全对等
- 产品迭代遵循「内部自用优先、挖掘潜在需求」的底层逻辑
- 访谈由Google DeepMind赞助,推出新版Gemini Vibe编码体验
详细精要
- 赞助环节信息:本播客由Google赞助,Google DeepMind产品设计负责人Omar宣布推出AI Studio新版vibe编码体验
- 用户只需描述应用需求,Gemini即可自动匹配对应模型与API完成搭建
- 新增「I'm feeling lucky」功能帮助用户快速启动项目,访问地址为a.studio/build
- 终端原生范式的非有意诞生过程:Claude Code的终端优先架构并非前期顶层设计,而是内部原型迭代的偶然产物
- 早期Anthropic内部有一款名为Clyde的笨重Python研究项目,启动需1分钟,依赖大量索引工作,实用性极低
- Boris入职后提交手写PR被上级Adam Wolf驳回,要求使用内部工具Quade完成开发,初次使用即被AI自动完成代码的能力震撼
- 后续Boris为快速测试Anthropic API,未做UI直接开发终端聊天原型,给模型开放bash工具后发现模型可自发调用bash、AppleScript完成自动化操作,由此确定终端架构方向
💬 精华片段(中文)
"它效果如此出色的核心原因是,Claude Code可以访问工程师在终端能操作的所有内容。你能做的所有操作,它都能做,二者之间没有任何限制。"
"What made it work really well is that quad code has access to everything that an engineer does at the terminal. Everything you can do, quad code can do. There's nothing in between."
[02:02] 工具设计与团队协作机制
本节重点
- 优先给模型开放原生bash能力,仅在有UX或权限需求时才新增定制工具
- 团队采用「ant fooding」内部测试机制,超70%技术员工日常使用Claude Code
- 产品迭代以自底向上的员工创意为主,客户反馈为辅
详细精要
- 工具设计哲学:优先给模型开放原生bash能力,尽量减少定制工具降低模型选择成本
- 当前Claude Code约有12个定制工具,每周都会新增或下线工具,核心目的是优化用户体验与权限管控
- 例如近期下线了OS专属工具,因为已经实现了bash层面的权限管控,可直接禁止Claude访问指定目录,无需额外工具
- 工具均为双向可用:工程师与模型均可调用,符合人类使用习惯的设计天然适配模型理解,无需额外适配
- 内部测试机制(ant fooding):Anthropic内部将员工称为「ant」,ant fooding即内部自食其果测试
- 超70%-80%的技术员工日常使用Claude Code,内部反馈频道每5分钟就有一条新反馈,可快速验证功能价值
- 所有新功能先推送给内部员工测试,出现bug或不受欢迎的功能直接下线,无需对外发布
- 团队分工与创意来源:Claude Code核心功能均来自自底向上的员工创意,而非顶层规划
- Boris负责技术方向与产品愿景,Cat负责定价包装、发布流程与客户沟通
- 例如bash模式(输入!直接执行bash命令)是Boris日常使用时频繁切换终端觉得麻烦,临时提出需求当天就上线;待办列表、子Agent、钩子、插件等功能均来自普通团队成员的创意
- 未来面向企业客户的功能将更多结合用户调研,优先适配高频需求
💬 精华片段(中文)
"我们把内部员工叫做ant,所以ant fooding就是我们版本的dog fooding。Anthropic超70%到80%的技术员工每天都在用Claude Code,每次我们想做新功能,先推给内部员工,能得到非常多反馈,我们的反馈频道每5分钟就有一条新消息。"
"Our nickname for internal employees is ant. And so ant fooding is our version of dog fooding. Internally over I think 70 or 80% of ants technical anthropic employees use cloud code every day. We have a feedback channel. I think we get a post every five minutes."
[09:48] 核心功能与使用技巧
本节重点
- 支持自定义slash命令、钩子、子Agent等扩展能力,开放全部可扩展接口
- 开发模式分为原型、一键完成、复杂功能规划三类,可匹配不同任务需求
- 子Agent可大幅提升批量任务效率,内部常用于代码迁移、漏洞扫描等场景
- 内置思考模式,可根据任务复杂度灵活切换,平衡速度与准确率
详细精要
- 核心扩展能力:Claude Code提供多层级扩展接口,支持用户自定义工作流
- Slash命令:支持自定义预定义bash指令,可提前配置权限无需重复确认,例如/commit命令可自动执行diff、生成合规commit信息、提交代码全流程,还支持Haiku模型加速执行降低成本
- 钩子(Hooks):可在任务任意节点插入确定性逻辑,例如停止钩子可在每轮交互结束后自动检查测试是否通过,若不通过则让模型继续修改,无需人工干预
- 插件系统:由团队成员Daisy开发,支持用户浏览、安装第三方MCP服务器、钩子、slash命令,一键导入到自己的工作流中
- 开发任务三类模式:用户可根据任务复杂度选择对应工作模式,大幅提升成功率
- 原型模式:不写详细需求,直接让Claude尝试实现,通过错误输出明确真实需求,适合前期需求模糊的场景,传统工程中此类原型成本极高,AI模式下可快速试错
- 一键完成模式:针对简单、模型可一次做对的任务,用户开启shift+tab自动接受权限,后台运行即可,无需人工值守
- 规划模式:针对需要数小时人工开发的复杂任务,先让模型输出详细计划,双方确认对齐后再开始编码,可将任务成功率提升2-3倍
- 子Agent使用场景:子Agent通过独立上下文窗口并行处理任务,大幅提升批量任务效率
- 内部常用于代码迁移场景:主Agent生成待办列表,同时启动10个子Agent并行处理迁移任务,Anthropic内部已有大量用户每月花费超1000美元Claude额度完成此类批量工作
- 代码审查场景:启动多个子Agent分别检查代码规范、Git历史、潜在Bug,再启动子Agent去重消除误报,最终输出的问题清单准确率极高,可覆盖大部分首轮代码审查工作
- 非编码场景也可使用:例如费用报销场景可设置两个子Agent分别代表员工与审计方,通过对抗辩论输出合规的报销清单
- 思考模式(Thinking Mode):支持模型调用内置思考能力,大幅提升复杂任务成功率
- 早期通过自然语言提示触发思考,后续优化为tab键一键切换,简单任务可关闭思考提升速度,复杂任务开启扩展思考提升准确率
- 保留了「ultra think」彩蛋功能,开启后思考过程显示为彩虹高亮,为内部受欢迎的趣味设计
💬 精华片段(中文)
"我觉得最酷的一点是,Claude Code作为终端UI,它能访问工程师在终端能做的所有操作。至于工具要不要做双向可用,我觉得做双向可用反而让工具更容易理解:你能做的所有事情,Claude Code都能做,中间没有任何隔阂。"
"I think one of the really cool things about Cloud Code being a terminal UI and what made it work really well is that Cloud Code has access to everything that an engineer does at the terminal. And I think when it comes to whether the tool should be dual use or not, I think making them dual use actually makes the tools a lot easier to understand. It just means that okay, everything you can do, cloud code can do. There's nothing in between."
[25:23] 产品迭代与定位转型
本节重点
- 遵循latent demand产品逻辑,优先开放扩展能力观察用户用法,再将高频用法产品化
- 从专属编码工具转型为通用Claude Agent SDK,已覆盖大量非编码场景
- 优先适配最新最强模型,不惧怕淘汰现有脚手架功能,全力打造顶级体验
- 正在探索自动记忆系统,解决模型遗忘历史经验的问题
详细精要
- 潜在需求(latent demand)产品迭代逻辑:优先打造高可扩展性的产品基底,观察用户的非预期用法,再将高频需求产品化
- 该逻辑在Meta曾成功孵化Facebook Dating、Marketplace等重量级产品,核心是基于已存在的用户行为而非凭空猜测需求
- 例如用户反馈希望离开电脑时Claude Code请求权限可发Slack通知,团队并未直接开发Slack集成,而是开放了钩子能力让用户自定义通知渠道,覆盖更多场景
- 开发者用户天生喜欢hack产品,开放扩展接口可快速挖掘大量未被满足的需求
- 向通用Agent SDK转型:Claude Code的底层Agent能力足够通用,已大量应用于非编码场景
- 内部已应用于工单去重、首响自动回复、Oncall日志聚合、市场调研等场景,外部用户已开发出健康助理、金融分析、法律助手、Obsidian笔记管理等非编码应用
- 底层核心是长周期Agent运行能力、联网能力、代码执行能力,三个能力组合可覆盖绝大多数自动化需求
- 未来将支持主动运行的Proactive Claude,可自动识别团队需求提前生成代码方案,当前优先提升单任务可靠性
- 技术选型优先级:优先适配Anthropic最新最强模型,不惧怕淘汰现有功能
- 例如昨日刚删除了系统提示词中2000个token的内容,因为Sonnet 45模型已经不需要这些提示即可完成任务,而Opus 41还需要
- 未来若模型可自动识别需要规划的场景,规划模式也会直接下线,团队不排斥短期的废弃代码,只要能给用户提供当前最优体验
- 暂不重点投入小模型适配,核心定位是高端生产力工具,优先保证最强模型下的体验
- 记忆系统探索:正在探索从任务日志中自动提取通用知识的记忆能力,解决模型遗忘历史经验的问题
- 部分内部用户会要求Claude Code每次任务结束后生成日记条目,记录尝试的方案、失败原因,再由专门的Agent合成通用经验
- 核心挑战是区分场景相关的临时指令(如「把按钮改成粉色」)与通用规则(如「按钮需符合无障碍设计规范」),避免错误记忆
- 企业用户已经在实践「复合工程」范式,将每次项目的经验沉淀到prompt、子Agent、slash命令中,让后续项目开发效率持续提升
💬 精华片段(中文)
"产品领域有个非常古老的概念叫做潜在需求,这是我做产品最核心的思路,非常简单:你把产品做的足够可扩展、足够开放,用户会把它用到你原本没有设计过的场景里,你看到大家怎么用之后再针对性做产品,因为你已经知道需求是真实存在的。"
"There's this like really old idea in product called latent demand which I think is probably the main way that I personally think about product and like thinking about what to build next is it's a super simple idea. It's you build a product in a way that is hackable that is kind of open-ended enough that people can abuse it for other use cases it wasn't really designed for. Then you see how people abuse it and then you build for that cuz like you you kind of know there was demand for it."
[40:33] 架构选择与用户体验
本节重点
- 放弃向量检索RAG,采用智能搜索方案,降低部署复杂度与安全风险
- 终端并非最终形态,团队正在实验IDE插件、Web版、移动端等多形态产品
- 降低非技术用户使用门槛,推出GUI版本降低学习成本
- 采用渐进式信息披露设计,平衡简洁性与专业用户需求
详细精要
- 架构选型决策:放弃向量检索RAG,采用Agentic智能搜索方案
- 早期曾用向量嵌入,但是需要持续索引代码、容易与本地修改冲突、企业部署安全风险高,最终放弃
- Claude模型的智能搜索能力已经可以达到和向量检索相同的准确率,部署更简单,无额外依赖
- 若用户需要语义检索能力,可通过MCP工具自行接入向量数据库,满足定制需求
- 多形态产品探索:终端并非最终形态,正在实验多端适配
- 已推出VS Code GUI扩展、Web版、移动端版、GitHub集成@claude功能,用户可在手机上远程提交任务
- 最新模型已可自主连续运行30小时以上,未来模型自主运行时间可达数天,需要新的产品形态适配长时间无人值守的运行需求
- 正在探索模型监控模型的能力,未来需要同时兼顾人类可审计、模型间通信高效两个需求
- 降低使用门槛:针对非工程师用户推出更易用的产品形态
- 非技术用户对终端有恐惧心理,首次使用会出现大量权限弹窗,学习成本高
- VS Code GUI扩展、Web版无需接触终端,采用传统按钮式界面,适合非技术用户入门
- 已看到大量数据科学家、产品经理等代码相邻岗位用户使用Claude Code,未来会持续优化易用性
- 渐进式信息披露设计:平衡新用户简洁性与专业用户深度需求
- 默认只显示核心信息,用户需要时可按Ctrl+O查看模型看到的完整原始转录本,无需一开始就暴露全部复杂度
- 功能命名均沿用开发者社区通用概念,例如钩子、插件等,用户听到名称即可理解用途,无需额外学习
- 模型会主动展示可用功能,例如调用slash命令时用户可观察学习,无需专门查看文档
💬 精华片段(中文)
"我认为终端不是最终的产品形态,我预测未来几个月到一年的时间里会出现更多新的产品形态,而且变化速度会非常快。"
"So my prediction is terminal is not the final form factor. My prediction is there's going to be a few more form factors in the coming months, you know, maybe like year or something like that. And it's going to keep changing very quickly."
[51:26] 工程文化与未来展望
本节重点
- AI驱动开发下,内部文化从文档优先转为Demo优先,原型迭代速度大幅提升
- 功能迭代遵循最小可用原则,随时可下线低使用率功能,保持产品简洁
- Anthropic内部工程师生产力自今年1月以来提升70%,远高于人员扩张速度
- 开源社区跟进CLI AI工具趋势,团队认为模仿是最高形式的赞美,聚焦自身需求迭代即可
详细精要
- 全新工程文化:AI驱动开发下,内部已经形成Demo优先的文化
- 过去产品提案需要写文档、画原型,现在可直接用Claude Code快速开发多个版本原型,直到体验符合预期
- 例如规划模式前后迭代了3个大版本,待办功能前后迭代了20多个原型,半天即可完成全部迭代
- 内部以Demo为核心沟通货币,15秒的Demo比几千字的文档更有说服力,大幅降低沟通成本
- 产品精简原则:严格控制功能复杂度,低使用率功能直接下线
- 内部以Instagram为参考,若功能使用率不足50%的周活用户,直接下线,不做功能堆积
- 下线功能时必须推出体验更好的替代方案,保证用户需求可被满足,避免引发用户不满
- 所有功能都需要遵循「无新用户学习成本」原则,用户听到功能名称即可理解用途,无需额外教学
- 生产力提升数据:Anthropic内部自2025年1月以来人员规模翻倍,但是人均工程师生产力提升了70%
- 核心衡量指标为PR数量,同时还覆盖了原型数量、创意落地速度等难以量化的提升
- AI让原本低于可行性门槛的小功能也可快速落地,产品丰富度大幅提升
- 随之而来的挑战是代码量激增,需要更完善的自动化代码审查、代码清理机制
- 行业竞争态度:认为社区模仿CLI AI工具是最高形式的赞美,不会改变自身迭代节奏
- 仅会在竞品发布时简单试用了解体验,核心还是聚焦解决内部与客户的真实需求
- 目标是推动整个行业探索AI原生开发范式,而非局限于竞品竞争
💬 精华片段(中文)
"Anthropic自今年1月以来人员规模几乎翻倍,但同期人均工程师生产力提升了近70%,我们主要用PR数量来衡量,这还没有算上原型数量、创意落地速度这些难以量化的提升。"
"Internally at anthropic I think we like doubled in size since January or something like that but then productivity per engineer has increased like almost 70% in that time. measured by uh I think we actually measured it yeah in a few ways but kind of PRs are the the simplest one and the main one."
专业术语注释
| 术语 |
解释 |
| Claude Code |
Anthropic推出的终端原生AI编码工具,具备完整终端操作权限,支持Agent、子Agent、扩展插件等能力,现已转型为通用Agent SDK |
| ant fooding |
Anthropic版的「dog fooding(自食其果)」,指内部员工优先测试自家产品,收集反馈迭代功能 |
| latent demand(潜在需求) |
产品开发理念,指通过开放产品能力观察用户非预期使用行为,挖掘真实存在但未被明确提出的需求 |
| slash command |
Claude Code中的斜杠命令,用户可自定义预定义的工作流,一键触发多个操作,无需重复输入指令 |
| hooks(钩子) |
Claude Code的扩展能力之一,可在Agent运行的任意节点插入确定性逻辑,自动执行预设操作 |
| MCP(Model Control Protocol) |
模型控制协议,Claude Code插件系统的底层协议,支持第三方工具接入Claude Code的能力 |
| Agentic RAG |
基于智能Agent的检索增强生成方案,由模型自主决定搜索内容与范围,无需依赖提前构建的向量索引 |
| Sonnet 45 |
Anthropic在2025年推出的新一代Claude大模型,是当前Claude Code默认适配的最强模型 |
| Opus 41 |
Anthropic上一代高端大模型,能力弱于Sonnet 45,需要更多的系统提示词引导完成任务 |
| Haiku |
Anthropic推出的轻量级大模型,速度快、成本低,适合执行简单、标准化的任务 |
| DSPY |
提示优化框架,用于系统化优化大模型的prompt与工作流,提升任务成功率 |
| Playwright/Puppeteer |
开源浏览器自动化测试工具,可作为MCP插件接入Claude Code,实现前端自动化测试、页面操作等能力 |
延伸思考
- 终端原生AI编码范式是否会成为未来主流?当前已有大量厂商跟进CLI形态的AI开发工具,未来IDE与CLI的边界会不会逐步消失?
- 企业采用Claude Code类AI开发工具时,如何平衡代码安全、权限管控与研发效率?Anthropic内部的settings.json集中配置机制是否可成为行业标准?
- 当模型自主运行时间达到数天级别时,如何构建可靠的模型监控、错误回滚、人类介入机制?当前的产品形态是否能适配这种长周期任务需求?
- AI驱动开发下,工程师的核心能力会发生什么变化?prompt技巧、快速原型迭代能力会不会替代传统的代码编写能力成为核心竞争力?
- 通用Agent SDK的普及会不会大幅降低软件开发门槛,让非技术人员也可快速构建复杂应用,未来会不会出现新的开发者生态?
原文发表:Oct 29, 2025 · 纪要生成:2026-02-25