来源: YouTube | Andrew Lampinen | May 20, 2026
播客: Stanford Online
分类: 其他
原文发表: May 20, 2026
纪要生成: 2026-06-22
Andrew Lampinen 是 Anthropic 的技术成员,此前曾在 Google DeepMind 担任研究科学家,在 斯坦福大学 获得认知心理学博士学位。他的研究连接人工智能与认知科学,聚焦语言模型和智能体的学习、泛化与表征。本场演讲中,他通过一系列受控实验,系统揭示语言模型从参数中提取的“固态知识”与从上下文临时获取的“即时知识”在泛化方式上的根本差异,并探讨了利用离线增强、在线检索和强化学习等策略来缩小这一差距的可能方案,最后将其投射到大脑海马体与新皮层的分工上去。
本节重点
详细精要
其个人 Substack 发布更多相关讨论,感兴趣的听众可关注。
核心问题:语言模型如何从所学中泛化?
对 AI 系统而言,我们可以设计在自然生物体上难以实现的控制实验:将全新信息以不同方式注入,然后测试其预测和泛化表现。
演讲路线概览:
💬 精华片段(中文) “What computational principles are shared across natural and artificial intelligence? … how do language models generalize from what they learn?” “自然智能与人工智能之间有哪些共享的计算原则?语言模型如何从所学的东西中泛化?”
本节重点
详细精要
但可能受限于信息在文档中的显式表达方式,导致泛化僵化。
上下文学习:利用大型模型的长上下文窗口,在输入中直接提供与任务相关的文档或示例。
因信息以原文形式保留在上下文里,保留了更丰富的细节,便于灵活调用。
两者的互补性:
💬 精华片段(中文) “One way they learn is that over a large training corpus, we optimize the network's parameters … The other … is their ability to learn from information in context.” “一种方式是在大型训练语料上优化网络参数以获得知识和技能;另一种是从上下文的信息中学习,这让人们最初对语言模型兴奋不已。”
本节重点
详细精要
这被称为 Reversal Curse:模型被“绑”在训练时的关系方向上,难以反向提取。
在上下文学习中的鲜明对比:
在 Lampinen 团队早前对更简单模型的实验中,此类反向推理几乎是天花板水平。
由此引出的核心假设:
💬 精华片段(中文) “If you try this experiment in the chat, the models are perfectly fine at it … is it possible that the way that models generalize from information that they encounter in their context is different from how they generalize from information they've stored in their parameters?” “如果在聊天界面做这个实验,模型完全没问题……有没有可能模型从上下文信息泛化的方式,与从参数中存储的信息泛化的方式不同?”
本节重点
详细精要
测试泛化方式包括关系逆转、三段论推理等,所有测试都使用未在训练中直接出现的问法。
逆转关系测试结果:
上下文学习直接拿到 99% 准确率,差距巨大。
三段论推理测试:
💬 精华片段(中文) “When you fine-tune the model on the relations in only one direction, it actually gets slightly worse than chance on these reversals. But if you just put the entire data set in context, the model is able to answer the reversals with 99% accuracy.” “当只对一个方向的关系进行微调时,模型在逆向上略低于随机;但若把整个数据集放入上下文,模型能以 99% 的准确率回答反向问题。”
本节重点
详细精要
模型在预训练中学会了如何在上下文里处理这类结构,因此当数据原封不动出现在上下文时,它天然能运用这些底层能力去提取隐含关系。
参数学习失败的可能解释:
训练集中也混合了正向陈述和上下文学习的逆向示例(如 “W contains Z” 后面紧跟 “Z are the subset of W”),只抽掉一小部分关系的逆向。
从头训练仍出现泛化失败:
这证明逆转泛化缺失并非只是微调现象,而是参数化学习更根本的属性——模型学到的知识紧紧绑定在训练数据的显式方向。
跨结构泛化同样失效:
💬 精华片段(中文) “They still get absolutely 0 generalization to the reversals. So this is really not just a phenomenon of fine-tuning. It's something more fundamental about how the models generalize from relational information in their training data.” “它们对逆反测试的泛化率依然是零。因此这不仅是微调现象,而是关于模型如何从训练数据中的关系信息泛化的更根本的问题。”
本节重点
详细精要
跨语言推导、对替代目标的泛化等也可归入此类潜层结构。
参数学习的“整合—固结”特征:
上下文学习则像打开原始材料放在面前,信息虽总量有限,但保留了进行复杂推导所需的丰富结构印记。
统计结构可“走捷径”掩盖泛化缺陷:
这意味着在非受控环境下,参数学习的这一缺陷往往不可见,但一旦脱离统计捷径(如纯粹的无意义词关系),泛化就崩溃。
统计泛化的期望效用与潜在风险:
💬 精华片段(中文) “If you give the model enough statistical structure, it can skip the need for doing systematic reversals or syllogistic inferences and just generalize based on the word co-occurrences alone.” “如果给模型足够的统计结构,它就可以跳过进行系统性逆反或三段论推导的需要,仅凭词共现就完成泛化。”
本节重点
详细精要
这样,潜层逻辑就被“写入”了训练数据,从而进入参数。
实验结果:
在三段论等需跨文档链接的任务上,增强微调甚至优于单次上下文学习,因为通过生成多条推理链,模型有机会拼凑出更完整的推理路径。
对合成数据“能否产生新知识”争论的澄清:
💬 精华片段(中文) “The information is really there in the data already. It's just that we're taking information that's implicit, that's latent in the data, and we're extracting it out and making it explicit and easily accessible to the model.” “信息实际上已经在数据中了。我们只是把那些隐含的、潜层的信息提取出来,使其变得显式且易于模型获取。”
本节重点
详细精要
因此需要一个按需检索机制,在测试时动态找回相关信息,重新注入上下文。
测试时检索实验设计:
在 codebooks 任务上,训练分布内测试检索与参数均良好;留出条件测试中,只有具备情节检索的系统能成功泛化。
检索带来灵活性的机制:
💬 精华片段(中文) “Even for documents that have been trained into the parameters, having that information available in context can allow the models to use it more flexibly and to answer questions better.” “即使文档已被训练进参数,让这些信息在上下文中显式可用,也能使模型更灵活地运用它们,更好地回答问题。”
本节重点
详细精要
核心直觉:模型其实已经“知道”所需信息——它能正向复述关系,也具备在上下文里做逆转的能力,只是难以自发地将两者组合。 RL 的作用相当于教它生成一条内部“检索与推理”的思维链。
实验设计:
设置基线:普通微调、对A做离线增强(augmentation)再看B的迁移。
结果:
红色条形图显示,RL 在部分结构上可弥合鸿沟,但在另一些结构上不彻底,呈现“半杯水”效果。
翻转难题的本质:
💬 精华片段(中文) “Models can learn via reinforcement learning how to regenerate information that they need in context at test time. And this can help with some of the problems quite a lot, but doesn't necessarily help with all of them.” “模型可以通过强化学习学会在测试时再生所需的上下文信息,这对某些问题很有帮助,但不一定解决所有问题。”
本节重点
详细精要
局限:必须事先决定可能重要的推理方向,无法应对所有未来未知使用场景。
测试时情节检索(Test-time retrieval):
地位:这里更多是概念验证,表明如果有一个好检索器,就能激发灵活泛化。
RL 自主回溯(RL-based self-generation):
内在难度:模型必须在浩瀚的已存知识中挑出对当前问题有用的片段,这本身就是挑战,尤其对逆转类问题极为困难。
综合视角:
💬 精华片段(中文) “These methods have different trade-offs … doing train time augmentation … can achieve performance as good or better than in-context learning. Test time episodic retrieval … can also achieve good performance. And this RL-based method achieves good performance on many kinds of structures, but not all of them.” “这些方法有不同的权衡……训练时增强可获得与上下文学习相当或更优的性能。测试时情节检索也能达到良好性能。基于 RL 的方法在很多结构上表现良好,但不是全部。”
本节重点
详细精要
观察海马体与新皮层之间的互动:新皮层类似参数学习系统,整合多经历形成统计规律;海马体负责对单个经历进行快速、丰富、高保真的存储。
海马体“离线增强”的证据:
这种活动模式类似前面提到的离线数据增强:大脑在休息或睡眠中把经验中的隐藏结构提炼出来,巩固到皮层。
海马体“在线检索”的证据:
这为上文中测试时检索或自我生成上下文的策略提供了生物学先例。
分工互补的可信解释:
💬 精华片段(中文) “It is possible that natural intelligence faces some of these same challenges … there might be evidence that natural intelligence also uses these different kinds of strategies to bridge the generalization gap, doing things like augmenting or training experiences offline and retrieving relevant information online.” “自然智能也可能面临同样的挑战……有证据表明,自然智能也采用类似策略来弥合泛化差距:比如离线增强或重组经验,以及在线检索相关信息。”
本节重点
详细精要
这些要素共同构成一个既能稳健统计又能灵活应变的泛化系统。
演讲核心回顾:
提出这些方法可能与海马体的离线预演、在线回放有相通之处,大脑或许远更聪明,但目前的探索已提供了有益框架。
致谢:
💬 精华片段(中文) “We need both consolidated information … procedures for reasoning about information flexibly in context, and … episodic memory that preserves experiences in rich detail … some of the functions of parameters in the language models … and the things that we put in context for them.” “我们需要固化信息、在上下文中灵活推理的程序,以及保留丰富经历的情节记忆……这些可以看作语言模型参数的功能与我们在上下文中为其提供的东西。”
本节重点
详细精要
稀疏性(如 MoE):未直接测试,但推测稀疏性主要在MLP层,而对上下文效应影响主要来自注意力层,所以差异可能不大,但不能完全排除。
学习速度与灾难性干扰的神经科学启示:
现代模型对语境极度敏感——一个负面反馈指令“别这样回答这种问题”,修改后只对极似的问题生效,泛化半径很窄,这可能也需借助检索类似案例来拓宽。
离线增强何时能超越ICL:
基本原理:上下文学习只从单条思考链命中答案;离线增强生成多条思考链,增大了正确推导被生成的几率,例如三段论任务中拼接正确链的可能性上升,从而微调后模型超越ICL。
统计捷径与逻辑推理的张力:
演讲者认为一定程度的统计结构是规范理性:面对真实世界无穷可能性,逻辑推理计算开销极大,统计关联提供有效约束。预训练语料的词共现正是这种约束来源,完全剥离内容会造成系统无法高效收敛到合理答案,正如早期纯符号AI面对世界时暴露出组合爆炸困境。
大脑类比的生动性与局限:
断裂点:
对构建AI行为准则的启示:
宪法性提示(constitution)与用户冲突指令之间的拉扯,无论依赖参数还是上下文都极具挑战。模型作为极强的上下文学习者,很难完全不被恶意上下文操控。因此两种方法都难以确保绝对行为可靠性。
关于资源分配和 Scaling Law:
💬 精华片段(中文) “The hippocampus does much more generative retrieval … many things you remember as episodic memories didn't actually happen … each time you think about it, it becomes a stronger encoding.” “海马体更多地进行生成式检索……你记得的许多情节记忆实际上并没有发生过,而每回想一次,记忆编码反而更强。”
| 术语 | 解释 |
|---|---|
| In-context Learning(上下文学习) | 将任务示例或相关文档直接放入模型的上下文窗口,使其在无需更新参数的情况下即时学习并执行任务。 |
| Fine-tuning(微调) | 在预训练模型基础上,利用特定数据集继续训练,将新知识或技能固化到模型参数中。 |
| Reversal Curse(逆转诅咒) | 模型学会正向关系(如A是B的父亲)后,无法自动回答反向问题(B的父亲是谁)的现象,表明参数学习的方向依赖性。 |
| Syllogistic Generalization(三段论泛化) | 基于两个已知命题推导出第三命题的逻辑能力,常用来测试模型是否能进行系统性关系推理。 |
| Parametric Learning(参数学习) | 通过更新网络权重将知识编码进模型,通常指预训练或微调过程,依赖于大量数据上的梯度优化。 |
| Episodic Memory(情节记忆) | 对具体事件或经历的存储,文中指模拟海马体功能,将特定训练文档保存并在测试时检索回上下文。 |
| Retrieval Augmented Generation (RAG)(检索增强生成) | 结合外部知识库,在生成回答前检索相关文档并加入上下文,提升事实性和推理能力。 |
| Reinforcement Learning (RL)(强化学习) | 此处指让模型通过试错和奖励信号学习生成推理链,从而在测试时自主从参数化记忆中“回想”所需信息。 |
| Hippocampus(海马体) | 大脑中对新事件进行快速编码并参与记忆巩固和回放的脑区,被类比为情节记忆系统。 |
| Neocortex(新皮层) | 哺乳动物大脑皮层的主要部分,负责缓慢学习与感知、语言等高阶功能,被类比为参数化的统计学习系统。 |
| Latent Information(潜层信息) | 训练文档中未直接陈述,但可由显式内容合乎逻辑地推导出的隐含知识。 |
| Online/Offline Replay(在线/离线重放) | 神经科学概念,指海马体在行为中或在休息时重新激活记忆模式,类似“检索”或“预演”,用于巩固和重组知识。 |
| Data Processing Inequality(数据处理不等式) | 信息论原理,说明对已有信息进行变换不可能凭空增加信息量,被引用以讨论合成数据不能创造新知识的观点。 |
| Scaling Law(缩放定律) | 描述模型性能与模型大小、数据量、计算量等资源之间关系的经验规律。 |