对话 Engram 创始人 Dan Biderman：为 AI 构建记忆层

来源： YouTube | Dan Biderman | Jun 23, 2026 分类： 其他 原文发表： Jun 23, 2026 纪要生成： 2026-06-24

全集重点

AI 的核心瓶颈是上下文与记忆：当前大语言模型每次对话都从零开始，缺乏对特定公司、团队或个人的持久记忆，这是限制其应用价值的关键。
从“文档索引”到“大脑状态”的范式转换：Engram 的目标不是优化传统的文档搜索（RAG），而是将知识直接“蒸馏”进模型的参数中，像训练一个专属的“大脑”一样。
“预准备”带来推理成本与质量的双重革命：通过在推理前进行针对性训练，Engram 的方案可将推理时的 Token 消耗量降低 10倍到100倍，同时避免无关信息造成的“上下文混淆”。
白盒模型与“传教士”团队是技术护城河：团队基于开源模型进行深度定制和“手术式”修改，其核心成员多是受愿景感召、为解决根本问题而放弃高薪的“传教士”型研究者。
商业化策略聚焦“自服务”与前沿企业共创：优先与 Notion、Harvey 等快速成长的 AI 原生公司深度合作，打磨出可规模化、低门槛的“自服务”产品，而非依赖人力密集的“部署工程师”模式。

嘉宾/话题简介

Dan Biderman 是 AI 初创公司 Engram 的创始人兼 CEO。他曾在哥伦比亚大学和斯坦福大学从事计算神经科学和 AI 智能体的研究，原本的学术生涯轨迹因一个强烈的信念而改变——即当今 AI 模型缺乏根本性的记忆和学习能力。他与来自斯坦福、伯克利、康奈尔等顶尖机构的专家团队共同创立了 Engram，致力于构建 AI 的“记忆层”，让模型能够学习、记住并利用海量上下文信息。

本集播客中，Dan Biderman 分享了从学术界转向创业的心路历程，深入探讨了 AI 在上下文理解方面的短板，并详细阐述了 Engram 如何通过全新的技术范式，帮助像 Microsoft、Notion、Harvey 这样的平台为其终端用户提供更智能、更高效、更具个性化的服务。

分节详述

[00:00] 从神经科学教授到 AI 创始人：Dan Biderman 的个人旅程

本节重点

Dan 本计划成为神经科学与 AI 领域的教授，而非创始人。
他在以色列长大，曾服役于情报与特种作战部门。
在斯坦福做博士后期间，他意识到通过运营公司可以做出更大贡献。
当团队形成一套关于“上下文与学习”的独特理念时，他决定全职创业。

详细精要

Dan 最初的职业目标不是创业，而是成为教授：他过去十年的学术生涯都专注于神经科学和 AI。
在 斯坦福大学 与 Chris Ray 合作做博士后研究，方向是 AI 智能体和效率。
在硅谷期间，他逐渐认识到，相比教书育人或担任公司顾问，通过创建和运营一家公司能够提供更直接的贡献路径。
多元背景塑造了创始人的独特视角：Dan 出生并成长于以色列特拉维夫，有两个兄弟姐妹。
他对科学、人文学科和人本身都抱有广泛兴趣。
曾在 以色列情报与特种作战部门 服役，这段经历可能培养了他解决复杂系统性问题的能力。
拥有 哥伦比亚大学理论神经科学中心 的博士学位。
创业的决定根植于对技术的差异化认知：团队形成了一套他们认为独特且具有明显差异化的想法。
这些想法集中在 AI 的 上下文（context）和学习（learning） 领域。
Dan 意识到，他们对此问题的理解“对我们来说是显而易见的，但对周遭其他人则不那么明显”，这种认知优势加上正在组建的团队，构成了他完全转向创业的“独特优势”和心理支撑。

💬 精华片段（中文）

“我们形成了一套对我们来说显而易见、但对周遭其他人则不那么明显的想法。那时我意识到，这里存在一个独特的优势，而正在组建的团队也足以支持我做出这个跳跃，改变人生轨迹。”

"...we've built a set of ideas that seem to us unique, differentiated, something that's obvious to us less so to others around context and learning... That's when I realized there there's there's a unique edge here and the team that that's assembling together is enough to to make this this jump and change course."

[02:04] 打造“传教士”团队：如何在巨头高薪下吸引顶尖人才

本节重点

当前环境下，AI 创业公司争夺顶尖人才极为困难，因为大实验室和云计算巨头能提供巨额薪酬。
Engram 核心团队由一群相信“世界本应如此”的“传教士”组成。
联合创始人与核心成员来自斯坦福、康奈尔、伯克利等顶尖机构，他们放弃了其他极具吸引力的机会。

详细精要

AI 创业公司的核心挑战是人才，而非资本：Dan 指出，虽然融资相对可行，但吸引正确的人才异常困难。
顶尖人才的 机会成本 极高，他们可以加入像 Anthropic 这样的实验室或大型云计算公司，获得“近乎疯狂”的薪酬。
相比之下，自己创业则需要“孤注一掷”。
团队的组建是“传教士”的集合，而非“雇佣兵”：核心成员加入的根本原因是他们对技术愿景的信仰。
CTO Sabri 面对众多诱人机会，最终决定全身心投入 Engram。
康奈尔大学的 Jack Morris 和 伯克利大学的 Jesse Lynn（专长于人机协作与后训练）也选择加入。
Dan 的导师、哥伦比亚大学和斯坦福大学的教授 Scott Linder 决定全职加入公司，共同工作。
团队的共同目标是解决 AI 的根本瓶颈：这群人多年来一直痴迷于同一个问题。
目标是构建能够 学习并记住海量知识库 的语言模型。
Dan 将此视为当前 AI 领域的主要瓶颈，即模型无法像人一样持续学习和记忆，每次互动都像是重新开始。
这个团队成员“多年来一直痴迷于这些问题”，现在他们聚在一起，旨在构建一个解决此问题的系统。

💬 精华片段（中文）

“组建一个 AI 公司，融资是一种活动，因为有资本，有东西可建。但招到对的人非常困难，因为机会成本太高了。人们可以去大实验室、去云计算巨头公司，拿到让他们自己创业都显得近乎疯狂的薪酬。”

"raising capital is one activity uh which there is capital and there's stuff to build in AI. Getting the right people is very hard uh because the opportunity cost is very high. People can go to the big labs and go to hyperscaler companies and get salaries that make it almost crazy though to start your own thing..."

[04:09] Engram 的差异化之道：为什么不与模型巨头正面竞争

本节重点

模型公司（如 Anthropic）的优先事项是构建能“自动化整个经济体”的通用模型（AGI），这与 Engram 完全不同。
当前主流技术（如长上下文提示工程）存在根本缺陷：每次对话从零开始，重读文件成本高，且上下文过长会导致模型“注意力分散”。
Engram 的独特切入点是：如何将海量知识库 蒸馏并注入 模型，实现自动化学习。

详细精要

认可巨头优势，但定位有根本区别：Dan 认为模型公司是“科技史上最强大、最可怕的既有巨头”，但他不打赌它们无法实现目标。
它们的主要优先事项是构建那个能够 自动化整个经济体的单一通用模型（AGI），并安全地部署它。
这涉及完善数据、大规模训练、评估、推理和强化学习（RL）。
Engram 的关注点则完全不同：即寻找将大规模知识库 喂养给模型的新方法。
指出“上下文窗口”范式的三大致命缺陷：自 Transformer 发明以来，核心交互方式“上下文学习”（即通过提示词把信息塞给模型）很少有本质创新，并且问题重重。
每次对话从零开始：模型在每次新对话开始时，从根本上是“空白”的，只能依靠临时注入的“便利贴”工作。
重读成本高昂：模型必须反复读取文件，临时注入信息，然后驱逐它们以处理下一个用户的查询。人们从今年开始已注意到推理成本（inference costs）成为一个必须担忧的问题。
上下文混淆（The "Context Fraud" Issue）：向模型投喂的信息越多，它反而会变得 越混乱、越不精确，这是一个根本性问题。
Engram 抓住的机遇是“知识蒸馏”：Dan 预测，到 2026 年，个人每天将产生 数千万个 Token，其中包含关于公司、工作、自身的宝贵知识，远超简单的人口统计信息。
Engram 的挑战在于，如何将海量、有价值的非结构化知识，以一种完全自动化的方式 蒸馏并固化回模型本身。
每个有趣的实验室都有团队在思考这个问题，但 Dan 打赌，这些实验室有“更紧迫、更具经济压力的其他事情要解决”。
Engram 的策略不是赌这些巨头的方案会失败，而是专注于这个细分市场，构建一个位于 数据层的新模型，这个模型会成为与公司知识对接的“新界面”。
未来“新数据”不再是文档或代码，而是模型经过学习后形成的 大脑状态。这就像是在构建一个新的记忆层，而其他更强大的“前沿模型”可以通过多智能体协作的方式，与其对话并获取信息。

💬 精华片段（中文）

“每次对话在根本意义上，模型都是从零开始的。它只是在配合演出，看到的只是关于我们和工作的便利贴。它必须重新读取文件，临时注入，然后将其驱逐，再去处理可能来自世界另一端的下一个查询。从服务和安全性角度来看这很方便，但它并不理想，因为重读东西相当昂贵。”

"The model starts every conversation in a fundamental sense from scratch... It is only seeing sticky notes about you know us and our work and our team but it has to reread files you know inject them temporarily then evict them and handle the next query from the next user somewhere else in the world. While this is very convenient for like a bunch of serving reasons and security reasons, it is unsatisfactory because you know rereading things is pretty expensive..."

[07:47] 惊人速度的秘诀：如何月内推出产品并吸引头部客户

本节重点

Engram 的策略是实现一个最简化的模型 API：接入资源后，模型能自主“消化”并学习。
成功的关键在于团队都是“传教士”，而非依赖高薪激励。
公司在与 Notion、Harvey、Figma 等客户的合作中高速迭代，采用“一边飞行一边修飞机”的模式。

详细精要

极简产品策略：聚焦模型与数据的接口：Dan 坦言公司成立仅数月，还没有完全部署好的产品，但有明确方向和早期成果。
核心在于提供一个极其清晰的 模型 API，这是与模型交互的最简方式。
用户只需授权模型访问其想要模型学习的资源，然后模型就能去“消化、吸收（dream about them, ingest them）”这些内容，最终被部署给用户。
团队努力不让自己因过多的产品体验而分散精力，因为对 Engram 来说，“模型与数据的接口”才是需要做对的唯一关键。
团队由“传教士”构成，这是速度的根源：所有成员都坚信世界的未来应该是这个样子。
尽管公司在早期阶段仍需证明商业成功，但吸引来的人都是基于共同的信仰。
Mayie Chen（斯坦福，LLM 数据与数据混合的世界级专家）、Howard Chen（普林斯顿，在“记忆和持续学习”还未被广泛讨论时就已深耕该领域）、Cade（曾在 Databricks 负责 LLM 推理运行时）——这些人是基于第一性原理，认为这项新基础设施必将存在而加入的。
商业化策略：与前沿客户“一边飞行一边修飞机”：Engram 通过与合作伙伴密切合作，在实际应用场景中学习和构建核心技术。
他们的客户包括 Notion、Harvey、Figma 等快速增长的 AI 原生公司。
这些公司拥有独特的数据集和模型交互方式，并正在平台上运行长时间运行的 AI 智能体。
Engram 在与这些客户的合作中，同步建设自己的核心技术，这种“一边飞一边修飞机”（fix the plane while flying）的模式允许他们在实战中快速学习。

💬 精华片段（中文）

“团队基本上是全是‘传教士’。他们都是相信世界应当是这个样子的人。即便在早期我们仍需证明商业成功时，所有这些我们聚集起来的人，他们都是基于第一性原理，相信存在一种新的基础设施和做事方式。”

"the team is all team of of basically missionaries. These are all people who believe that the world should look in this way. Even uh you know in our early stages where we still have to prove our commercial success... these are all people who believe there's a new infrastructure there's a new way of doing things it has to be like this from first principles."

[10:24] Engram 的价值引擎：成本、速度与质量的“不可能三角”破局

本节重点

为快速增长的 AI 原生公司（如 Harvey、Notion）提供“预准备”模型，使其在交互时无需从海量底层系统中反复搜索。
核心价值体现在 推理 Token 的 10-100 倍巨幅降低 和 答案质量的提升。
“预训练”带来了新的单位经济模型，并非免费午餐，但其效益显著。

详细精要

“预准备”模式革新了 Agent 的任务处理方式：当前的大模型完成任务依赖于临时的、大规模的动态搜索，而 Engram 的模型能在交互前就做好准备。
典型场景：在 Slack 中处理一个技术故障工单，传统方式下，模型需要向所有相关 Slack 频道、GitHub PR、Notion 页面发出查询请求。
Engram 模型的能力：它能“不假思索”地知道团队成员是谁、谁负责什么、什么是重要的。即便有信息缺失，它也会明确知道 去哪里搜索，而不是盲目地全面搜索。
这解决了一个关键痛点：在当前智能体系统中，“一切都依赖搜索，但有时你甚至都不知道要搜什么”。
带来量化的成本与效率革命：Engram 的“预准备”模式并非零成本，但它创造了全新的单位经济模型。
推理 Token 消耗锐减：Dan 透露观察到 10倍到100倍的推理 Token 减少量。
并非免费午餐：这种收益源于在查询前进行的 预先训练，这带来了新型有趣的单位经济模型，是他们独特价值主张的一部分。
显著提升模型输出质量：除了成本，模型回答的质量也得到根本性改善。
传统模式会向模型注入大量 无关知识，导致其在没必要的事情上浪费推理资源。
通过 高效、定向 地注入知识，模型能够避免混淆，就像一个对办事流程极其熟悉的助手，能迅速、准确地完成任务。
这关乎的不仅仅是效率，更是 质量和用户体验，让最终产品能够实现增长。

💬 精华片段（中文）

“我们已经看到推理 Token 消耗减少了 10 倍甚至 100 倍。这并不是免费的午餐。你只有通过提前进行某种训练才能获得这种收益，而这带来了我们正在提供的、有趣的新型单位经济模型。”

"We've seen like 10x 100x reductions in inference tokens. This is not a free lunch. This you get this only if you do some training ahead of time which has this new interesting unit economics that we're we're offering."

[18:43] 连接信息孤岛：Engram 如何消化和处理海量企业上下文

本节重点

以 Microsoft 365 生态为例，展示了企业上下文数据的庞大和复杂性（文档、信息、会议记录等）。
核心技术挑战在于如何将这些多源异构数据“蒸馏”成一个能被企业控制的“大脑”。
数据安全与权限控制是必须解决的难题，需要实现不同用户拥有不同的信息视图。

详细精要

企业数据源极其丰富和复杂：Dan 以 Microsoft 365 的工作生态为例进行了说明。
当今大多数企业都运行在这个生态系统中，包括 Office 套件 中的 Word 文档、Excel 表格、云端 SharePoint 文件、各类通信消息以及会议录音。
所有这些数据都以用户、团队、企业的不同层级被保存下来，微软多年来已将其建设成一个极具价值的知识层。
核心任务：将知识图谱蒸馏为“大脑”：Engram 的本质工作是对这些信息进行深度处理。
他们的主要任务是如何将这个庞大的 知识图谱（knowledge graph）和多种输入、工件，找到一种方法 蒸馏成一个可由公司控制的“大脑”。
关键是让模型学会 识别有效信息 所在，即“聪明的东西在哪里”。例如，Slack 里就包含了大量的上下文信息和“热乎的观点”，而模型需要学会在不泄密的情况下学习它们。
数据权限处理是核心难题与创新点：在多用户环境下的数据隔离是关键挑战。
Dan 提出了一个典型场景：同公司内的两个同事，其中一个可以查看 HR 和薪资信息，另一个则不行。
这要求 Engram 能够以一种创造性的方式在“大脑”中进行编排，确保 每个用户都能获得独特的视图，但机密信息不会在不同人之间泄露。
这需要在技术层面解决如何将复杂的权限体系也映射到模型的学习和记忆过程中。

[21:51] 以小博大：数月公司如何赢得像微软这样的巨头合作

本节重点

Engram 以“好奇心”和“探索 AI 根本问题”为出发点，而非仅仅售卖产品。
巨头的核心诉求是保持对 AI 前沿的探索，他们愿与提供独特、差异化技术路径的团队合作。
成功的合作基础是双方互相学习，以及大公司领导者对前沿 AI 的深刻理解和亲力亲为。

详细精要

与巨头接触的出发点是“共同学习”而非销售：Dan 强调，更重要的是对 AI 根本问题的好奇心和共同探索。
对 Engram 而言，弄清楚这个根本性的 AI 问题比直接向人销售产品更紧迫。
包括微软在内的巨头公司，都希望处于 AI 的最前沿，并愿意与能够带来12至18个月后可能成为智能体工作负载必备技术的团队进行实验。
提供独特且有差异化的技术路径预览：这种“合作性方法”（collaborative approach）之所以有效，是因为 Engram 提供了非常不同的观点。
核心在于提供“我们认为技术栈未来会走向何方的预览，这与许多其他人看到的根本不同。”
虽然尚未证明自己是对的，但这种清晰且第一性原理的差异化观点本身就具有极强的吸引力。
大公司领导层的“AI 信仰”是关键促成因素：合作的成功离不开对方决策者的个人特质。
这些公司的领导层 极其亲力亲为、对 AI 深信不疑、对 AI 前沿技术了如指掌。
他们正在积极寻找像 Engram 这样、以不同方式做事的团队和个人，即使这意味着伴随风险。正是这种领导力层面的“知音”，让一家只有数月历史的公司得以与行业巨头展开实质性合作。

💬 精华片段（中文）

“有帮助的是这种合作性的方法，即‘让我们互相学习’，并让你预览我们认为技术栈将走向何方——这与许多其他人所看到的有根本性的不同。我们是对是错还有待观察，但我认为对我们来说，是好奇心，同时也因为这些公司的领导者极其亲力亲为、对 AI 深信不疑、对 AI 前沿了如指掌，并正在寻找这样以不同方式行事的团队和人，即使这有风险。”

"the thing that helps is this kind of collaborative approach that let's learn from each other and let kind of give you the preview of where we think the stack is going which is fundamentally different from what many other people are seeing... for us it's it's curiosity and for us it's also um having the leadership of the companies really being like extremely hands-on extremely AI pilled extremely well-versed in the frontier of AI and looking for these kinds of teams and people who are doing things differently even if it's risky."

[23:24] 商业化蓝图：“自服务”模式与从 AI 原生企业到大型企业的扩张

本节重点

公司早期阶段致力于打造一款尽可能“自服务”（self-served）的产品。
当前的策略是与 AI 原生初创公司 深度合作，快速迭代获取反馈。
公司 DNA 更偏向“前沿实验室”，因此选择“自服务”而非“部署工程师”作为规模化的核心路径。
未来一年目标是扩大部署规模，让用户能像培育 拓麻歌子 一样培育自己的模型。

详细精要

市场进入（GTM）策略分为两个阶段：Dan 坦承目前还没有完全成熟的商业 GTM 工作，大部分由创始团队亲自推进。
第一阶段：聚焦 AI 原生合作伙伴。 目标是打造尽可能“自服务”的产品。当前对早期合作伙伴进行大量“手把手指导”，是为了最大程度地从他们身上学习。重点瞄准那些 发展迅速的 AI 原生初创公司和企业，因为他们经验丰富、敢于尝试、能提供快速反馈。
第二阶段：向更广泛的企业和开发者开放。 一旦产品打磨得更加“坚实”，API 足够稳定和通用，就会将其推向更大型的企业，并尝试将模型开放给任何开发者，提供更加面向开发者的工具。
“自服务”模式 vs. “部署工程师”模式的战略抉择：Dan 基于对公司 DNA 的深刻认知做出了这个决策。
他们反问自己：“我们的 DNA 是什么？我们是服务公司还是更像前沿实验室？” 答案显然是后者。
他们认为，当前流行的“部署工程师”模式是在散播一项我们已经大致知道其形态和益处的技术。尽管这很困难且需要智慧，但它并非技术突破本身。
而对于前沿实验室来说，真正的 解锁点（unlock） 是创造出“疯狂”的技术。如果技术足够强大，用户教育 就能自然发生，因为用户会主动想学习如何使用它。这种产品的增长速度将是前所未有的。
未来蓝图：从服务大平台到赋能每个开发者：Dan 描绘了一个比当前服务大客户更广阔的未来。
近期目标：到年底前，为 Microsoft、Harvey、Notion 等客户的终端用户创建数百万个“神经记忆”（neural memories），让它们能记住用户的工作区和任务。
长远愿景：让开发者和个人能够构建自己的模型，你投入的时间越多，模型就变得越好，就像一只 拓麻歌子（Tamagotchi）。
他对比指出，即便你今天全职为 GPT 优化上下文和提示，下一代模型一出，你所有的工程努力都会被冲刷掉。而 Engram 的目标是，让你投入的每一次数据交互，都能成为模型持续学习并返回给你的一部分。

💬 精华片段（中文）

“即便你现在从 GC 辞职，将让 GPT 成为对你来说最好用的模型作为毕生使命，你的努力也将是徒劳的，因为下一代模型一出，你做的所有上下文工程和准备的便利贴都会被冲刷掉。我们想做到的是，如果你选择构建自己的模型，你投入的时间越多，模型就去学习，然后第二天回来就会记住这一切。”

"even if you resigned from GC and your sole mission was to make GPT the best model possible for you... your efforts would be, you know, pretty much futile because the next generation of the model comes, you will wash out all the context engineering that you do and all the sticky notes that you prepare... We want to make it so that you know if you choose to actually build your own model, the more time you dedicate with it, the model then goes and learns it and comes back the next day and knows it."

[34:51] CEO 的焦虑与反思：从完美主义学者到公司建造者

本节重点

Dan 最大的焦虑是关于产品是否为客户提供了最大价值，以及团队是否押注了正确的产品形态。
第二大挑战在于持续吸引和说服顶尖人才在当前环境下承担财务上的风险。
在角色转变上，他最大的学习是从追求“学术完美”到适应“公司世界的快速迭代”。
一个意外之喜是，许多看似背景不同的人才，都渴望接近 AI 堆栈最深的创新，这为团队带来了意想不到的多元化。

详细精要

CEO 三个最大的焦虑：
产品价值验证：这个巨大的赌注——即模型需要从根本上改变——是否正确？是否找到了正确的产品形态，能让用户在与模型的最小化交互中迅速看到价值，而不需要复杂的训练跑数和大量的手把手指导？这是最关键的存在性问题。
人才招聘困境：在 AI 人才薪酬极高的时代，如何找到并说服合适的人承担风险，即使公司成功，他们的机会成本也可能是每年数千万美元。Dan 的目标不是操纵他们加入，而是说服他们相信这里有“审美上、智力上、经济上”都与众不同的东西。
确保公司不因 AI 进步而“被颠覆”：必须假设 AI 的进步不会停止（如 Anthropic 的技术会继续发展），不能停留在对现有模型缺陷的修补上。构建的产品必须是 互补的和差异化的，能随着模型改进而改进，并确保其差异化程度高到第二天不会被模型供应商的新功能直接替代。
从“学术界”到“CEO”的重大转变和自我发现：
告别“完美主义”：学术界的核心是打造一件完美的作品，花一年甚至三年去打磨它，然后一次性展示出来，成为“大师之作”。而在公司世界里，必须学会 不要当完美主义者，要快速设置检查点，并持续前进。
发现角色的多样性乐趣：CEO 的角色比他想象中提供了更多的多样性，能更好地发挥他的好奇心和不同特质。而在学术界，他感觉更多是“埋头苦干，搞出下一篇论文”。
意外的收获：顶尖人才渴望“深度创新”：一个惊喜是，吸引人才的范围比预期更广。
Dan 原以为需要费力去招募那些“疯狂的工程师或商业人士”，但实际上，许多背景各异但能力超群的聪明人，都渴望与这些在 AI 实验室“心脏”受过教育训练的研究者更紧密地合作。
他们想参与的不是又一家泛 AI 公司，而是一家希望处在技术堆栈最深层次创新的公司。这不仅让招聘变得更容易，也为团队带来了新的视角和贡献。

专业术语注释

术语	解释
上下文学习 (In-context Learning)	大语言模型的一种交互范式，即在推理时将相关信息和指令作为提示词的一部分提供给模型，使其能基于此生成回答，而不需要改变模型本身的参数。
推理成本 (Inference Costs)	模型在训练完成后，响应用户请求并生成输出所需消耗的计算资源和费用，通常以处理的 Token 数量计价。
上下文混淆 (Context Fraud)	Dan Biderman 用来形容大型语言模型的一个众所周知的问题：当提供给模型的上下文（信息）过长或庞杂时，模型的准确度和专注度反而会显著下降。
知识蒸馏 (Distilling Knowledge)	在本集语境中，指 Engram 的核心技术理念，即通过特定的训练方法，将海量的企业或个人知识库信息，提炼并内化到模型的参数中，使其成为模型“常识”或记忆的一部分。
RAG (检索增强生成)	一项将被 Engram 改变的技术范式。RAG 在推理时从外部知识库动态检索相关信息并注入给模型，而 Engram 的方式则是将信息提前“训练”进模型。
Token	大语言模型处理和生成文本的基本单位，可以是单词、词的一部分或标点符号。Token 消耗量直接关联到模型推理的成本。
白色盒子访问 (White Box Access)	指对模型的内部参数、权重、架构有完全的访问权限，可以进行深度微调、修改和定制。这区别于只能通过 API 调用的“黑盒”模型，是 Engram 技术实现的基础。
灾难性遗忘 (Catastrophic Forgetting)	神经网络在学习新数据时，大幅度遗忘或覆盖掉之前学到的旧知识的现象。这是实现持续学习的核心挑战，也是 Engram 技术必须解决的问题。
神经存储器/适配器 (Neural Cartridges/Adapters)	Engram 提出的概念，指可以被高效载入语言模型中、像“游戏卡带”一样可以热插拔的、包含特定领域或用户记忆的参数模块。
拓麻歌子 (Tamagotchi)	一种电子宠物玩具。Dan 用它来比喻一种理想化的个人 AI 模型：用户投入时间与数据去“培育”它，它就会变得更好用、更“健康”。
前沿实验室 (Frontier Lab)	指像 Anthropic、OpenAI、Google DeepMind 这样致力于研发最强大、最通用的前沿 AI 模型的顶尖研究机构。

延伸思考

“记忆即服务”（Memory-as-a-Service）的经济学：如果 Engram 的范式成功，AI 的计费模式可能会从单一的“按 Token 付费”转向包含“按记忆训练量付费”等更多维度。这将如何重塑 AI 应用的成本结构和商业模式？
Agent 的新基石：当前讨论的 AI Agent 大多依赖强大的推理能力和工具调用。Dan 提出的“先验知识 + 定向搜索”范式，是否会成为下一代 Agent 能力突破的核心支柱，解决当前 Agent 在执行长任务时容易迷失的问题？
隐私与数据主权的双刃剑：Engram 的方案意味着要将企业最核心的上下文知识蒸馏到一个模型中。当这个“大脑”被创建后，模型销毁、数据擦除、权限动态变更等安全治理问题将面临全新的、更复杂的挑战。如何确保“遗忘权”？
对巨头护城河的冲击：如果 Engram 这样的公司在数据层构建了一个优秀的记忆模型，它是否会成为各大“前沿实验室”模型都必须接入的一个中间件？这是否会从某种程度上抽象掉底层模型的差异，从而打破现有巨头的垄断？
创始人的“传教士”领导力：Dan Biderman 分享的团队建设哲学非常纯粹。这种高度依赖“信仰一致性”的团队，在面临商业化的巨大压力、战略转向或残酷的竞争时，其凝聚力和抗风险能力将如何演变？这是否是顶尖 AI 人才团队的一种可规模化的组建模式？

原文发表：Jun 23, 2026 · 纪要生成：2026-06-24