来源: YouTube | Dan Biderman | Jun 23, 2026 分类: 其他 原文发表: Jun 23, 2026 纪要生成: 2026-06-24
Dan Biderman 是 AI 初创公司 Engram 的创始人兼 CEO。他曾在哥伦比亚大学和斯坦福大学从事计算神经科学和 AI 智能体的研究,原本的学术生涯轨迹因一个强烈的信念而改变——即当今 AI 模型缺乏根本性的记忆和学习能力。他与来自斯坦福、伯克利、康奈尔等顶尖机构的专家团队共同创立了 Engram,致力于构建 AI 的“记忆层”,让模型能够学习、记住并利用海量上下文信息。
本集播客中,Dan Biderman 分享了从学术界转向创业的心路历程,深入探讨了 AI 在上下文理解方面的短板,并详细阐述了 Engram 如何通过全新的技术范式,帮助像 Microsoft、Notion、Harvey 这样的平台为其终端用户提供更智能、更高效、更具个性化的服务。
本节重点
详细精要
在硅谷期间,他逐渐认识到,相比教书育人或担任公司顾问,通过创建和运营一家公司能够提供更直接的贡献路径。
多元背景塑造了创始人的独特视角:Dan 出生并成长于以色列特拉维夫,有两个兄弟姐妹。
拥有 哥伦比亚大学理论神经科学中心 的博士学位。
创业的决定根植于对技术的差异化认知:团队形成了一套他们认为独特且具有明显差异化的想法。
💬 精华片段(中文)
“我们形成了一套对我们来说显而易见、但对周遭其他人则不那么明显的想法。那时我意识到,这里存在一个独特的优势,而正在组建的团队也足以支持我做出这个跳跃,改变人生轨迹。”
"...we've built a set of ideas that seem to us unique, differentiated, something that's obvious to us less so to others around context and learning... That's when I realized there there's there's a unique edge here and the team that that's assembling together is enough to to make this this jump and change course."
本节重点
详细精要
相比之下,自己创业则需要“孤注一掷”。
团队的组建是“传教士”的集合,而非“雇佣兵”:核心成员加入的根本原因是他们对技术愿景的信仰。
Dan 的导师、哥伦比亚大学和斯坦福大学的教授 Scott Linder 决定全职加入公司,共同工作。
团队的共同目标是解决 AI 的根本瓶颈:这群人多年来一直痴迷于同一个问题。
💬 精华片段(中文)
“组建一个 AI 公司,融资是一种活动,因为有资本,有东西可建。但招到对的人非常困难,因为机会成本太高了。人们可以去大实验室、去云计算巨头公司,拿到让他们自己创业都显得近乎疯狂的薪酬。”
"raising capital is one activity uh which there is capital and there's stuff to build in AI. Getting the right people is very hard uh because the opportunity cost is very high. People can go to the big labs and go to hyperscaler companies and get salaries that make it almost crazy though to start your own thing..."
本节重点
详细精要
Engram 的关注点则完全不同:即寻找将大规模知识库 喂养给模型的新方法。
指出“上下文窗口”范式的三大致命缺陷:自 Transformer 发明以来,核心交互方式“上下文学习”(即通过提示词把信息塞给模型)很少有本质创新,并且问题重重。
上下文混淆(The "Context Fraud" Issue):向模型投喂的信息越多,它反而会变得 越混乱、越不精确,这是一个根本性问题。
Engram 抓住的机遇是“知识蒸馏”:Dan 预测,到 2026 年,个人每天将产生 数千万个 Token,其中包含关于公司、工作、自身的宝贵知识,远超简单的人口统计信息。
💬 精华片段(中文)
“每次对话在根本意义上,模型都是从零开始的。它只是在配合演出,看到的只是关于我们和工作的便利贴。它必须重新读取文件,临时注入,然后将其驱逐,再去处理可能来自世界另一端的下一个查询。从服务和安全性角度来看这很方便,但它并不理想,因为重读东西相当昂贵。”
"The model starts every conversation in a fundamental sense from scratch... It is only seeing sticky notes about you know us and our work and our team but it has to reread files you know inject them temporarily then evict them and handle the next query from the next user somewhere else in the world. While this is very convenient for like a bunch of serving reasons and security reasons, it is unsatisfactory because you know rereading things is pretty expensive..."
本节重点
详细精要
团队努力不让自己因过多的产品体验而分散精力,因为对 Engram 来说,“模型与数据的接口”才是需要做对的唯一关键。
团队由“传教士”构成,这是速度的根源:所有成员都坚信世界的未来应该是这个样子。
Mayie Chen(斯坦福,LLM 数据与数据混合的世界级专家)、Howard Chen(普林斯顿,在“记忆和持续学习”还未被广泛讨论时就已深耕该领域)、Cade(曾在 Databricks 负责 LLM 推理运行时)——这些人是基于第一性原理,认为这项新基础设施必将存在而加入的。
商业化策略:与前沿客户“一边飞行一边修飞机”:Engram 通过与合作伙伴密切合作,在实际应用场景中学习和构建核心技术。
💬 精华片段(中文)
“团队基本上是全是‘传教士’。他们都是相信世界应当是这个样子的人。即便在早期我们仍需证明商业成功时,所有这些我们聚集起来的人,他们都是基于第一性原理,相信存在一种新的基础设施和做事方式。”
"the team is all team of of basically missionaries. These are all people who believe that the world should look in this way. Even uh you know in our early stages where we still have to prove our commercial success... these are all people who believe there's a new infrastructure there's a new way of doing things it has to be like this from first principles."
本节重点
详细精要
这解决了一个关键痛点:在当前智能体系统中,“一切都依赖搜索,但有时你甚至都不知道要搜什么”。
带来量化的成本与效率革命:Engram 的“预准备”模式并非零成本,但它创造了全新的单位经济模型。
并非免费午餐:这种收益源于在查询前进行的 预先训练,这带来了新型有趣的单位经济模型,是他们独特价值主张的一部分。
显著提升模型输出质量:除了成本,模型回答的质量也得到根本性改善。
💬 精华片段(中文)
“我们已经看到推理 Token 消耗减少了 10 倍甚至 100 倍。这并不是免费的午餐。你只有通过提前进行某种训练才能获得这种收益,而这带来了我们正在提供的、有趣的新型单位经济模型。”
"We've seen like 10x 100x reductions in inference tokens. This is not a free lunch. This you get this only if you do some training ahead of time which has this new interesting unit economics that we're we're offering."
本节重点
详细精要
所有这些数据都以用户、团队、企业的不同层级被保存下来,微软 多年来已将其建设成一个极具价值的知识层。
核心任务:将知识图谱蒸馏为“大脑”:Engram 的本质工作是对这些信息进行深度处理。
关键是让模型学会 识别有效信息 所在,即“聪明的东西在哪里”。例如,Slack 里就包含了大量的上下文信息和“热乎的观点”,而模型需要学会在不泄密的情况下学习它们。
数据权限处理是核心难题与创新点:在多用户环境下的数据隔离是关键挑战。
本节重点
详细精要
包括 微软 在内的巨头公司,都希望处于 AI 的最前沿,并愿意与能够带来12至18个月后可能成为智能体工作负载必备技术的团队进行实验。
提供独特且有差异化的技术路径预览:这种“合作性方法”(collaborative approach)之所以有效,是因为 Engram 提供了非常不同的观点。
虽然尚未证明自己是对的,但这种清晰且第一性原理的差异化观点本身就具有极强的吸引力。
大公司领导层的“AI 信仰”是关键促成因素:合作的成功离不开对方决策者的个人特质。
💬 精华片段(中文)
“有帮助的是这种合作性的方法,即‘让我们互相学习’,并让你预览我们认为技术栈将走向何方——这与许多其他人所看到的有根本性的不同。我们是对是错还有待观察,但我认为对我们来说,是好奇心,同时也因为这些公司的领导者极其亲力亲为、对 AI 深信不疑、对 AI 前沿了如指掌,并正在寻找这样以不同方式行事的团队和人,即使这有风险。”
"the thing that helps is this kind of collaborative approach that let's learn from each other and let kind of give you the preview of where we think the stack is going which is fundamentally different from what many other people are seeing... for us it's it's curiosity and for us it's also um having the leadership of the companies really being like extremely hands-on extremely AI pilled extremely well-versed in the frontier of AI and looking for these kinds of teams and people who are doing things differently even if it's risky."
本节重点
详细精要
第二阶段:向更广泛的企业和开发者开放。 一旦产品打磨得更加“坚实”,API 足够稳定和通用,就会将其推向更大型的企业,并尝试将模型开放给任何开发者,提供更加面向开发者的工具。
“自服务”模式 vs. “部署工程师”模式的战略抉择:Dan 基于对公司 DNA 的深刻认知做出了这个决策。
而对于前沿实验室来说,真正的 解锁点(unlock) 是创造出“疯狂”的技术。如果技术足够强大,用户教育 就能自然发生,因为用户会主动想学习如何使用它。这种产品的增长速度将是前所未有的。
未来蓝图:从服务大平台到赋能每个开发者:Dan 描绘了一个比当前服务大客户更广阔的未来。
💬 精华片段(中文)
“即便你现在从 GC 辞职,将让 GPT 成为对你来说最好用的模型作为毕生使命,你的努力也将是徒劳的,因为下一代模型一出,你做的所有上下文工程和准备的便利贴都会被冲刷掉。我们想做到的是,如果你选择构建自己的模型,你投入的时间越多,模型就去学习,然后第二天回来就会记住这一切。”
"even if you resigned from GC and your sole mission was to make GPT the best model possible for you... your efforts would be, you know, pretty much futile because the next generation of the model comes, you will wash out all the context engineering that you do and all the sticky notes that you prepare... We want to make it so that you know if you choose to actually build your own model, the more time you dedicate with it, the model then goes and learns it and comes back the next day and knows it."
本节重点
详细精要
确保公司不因 AI 进步而“被颠覆”:必须假设 AI 的进步不会停止(如 Anthropic 的技术会继续发展),不能停留在对现有模型缺陷的修补上。构建的产品必须是 互补的和差异化的,能随着模型改进而改进,并确保其差异化程度高到第二天不会被模型供应商的新功能直接替代。
从“学术界”到“CEO”的重大转变和自我发现:
发现角色的多样性乐趣:CEO 的角色比他想象中提供了更多的多样性,能更好地发挥他的好奇心和不同特质。而在学术界,他感觉更多是“埋头苦干,搞出下一篇论文”。
意外的收获:顶尖人才渴望“深度创新”:一个惊喜是,吸引人才的范围比预期更广。
| 术语 | 解释 |
|---|---|
| 上下文学习 (In-context Learning) | 大语言模型的一种交互范式,即在推理时将相关信息和指令作为提示词的一部分提供给模型,使其能基于此生成回答,而不需要改变模型本身的参数。 |
| 推理成本 (Inference Costs) | 模型在训练完成后,响应用户请求并生成输出所需消耗的计算资源和费用,通常以处理的 Token 数量计价。 |
| 上下文混淆 (Context Fraud) | Dan Biderman 用来形容大型语言模型的一个众所周知的问题:当提供给模型的上下文(信息)过长或庞杂时,模型的准确度和专注度反而会显著下降。 |
| 知识蒸馏 (Distilling Knowledge) | 在本集语境中,指 Engram 的核心技术理念,即通过特定的训练方法,将海量的企业或个人知识库信息,提炼并内化到模型的参数中,使其成为模型“常识”或记忆的一部分。 |
| RAG (检索增强生成) | 一项将被 Engram 改变的技术范式。RAG 在推理时从外部知识库动态检索相关信息并注入给模型,而 Engram 的方式则是将信息提前“训练”进模型。 |
| Token | 大语言模型处理和生成文本的基本单位,可以是单词、词的一部分或标点符号。Token 消耗量直接关联到模型推理的成本。 |
| 白色盒子访问 (White Box Access) | 指对模型的内部参数、权重、架构有完全的访问权限,可以进行深度微调、修改和定制。这区别于只能通过 API 调用的“黑盒”模型,是 Engram 技术实现的基础。 |
| 灾难性遗忘 (Catastrophic Forgetting) | 神经网络在学习新数据时,大幅度遗忘或覆盖掉之前学到的旧知识的现象。这是实现持续学习的核心挑战,也是 Engram 技术必须解决的问题。 |
| 神经存储器/适配器 (Neural Cartridges/Adapters) | Engram 提出的概念,指可以被高效载入语言模型中、像“游戏卡带”一样可以热插拔的、包含特定领域或用户记忆的参数模块。 |
| 拓麻歌子 (Tamagotchi) | 一种电子宠物玩具。Dan 用它来比喻一种理想化的个人 AI 模型:用户投入时间与数据去“培育”它,它就会变得更好用、更“健康”。 |
| 前沿实验室 (Frontier Lab) | 指像 Anthropic、OpenAI、Google DeepMind 这样致力于研发最强大、最通用的前沿 AI 模型的顶尖研究机构。 |