▶ 原文链接

自动微分改变了一切(而非Transformer)[Dr. Jeff Beck]

来源: YouTube | Jeff Beck 博士 | 2025年12月31日 分类: 其他 原文发表: Dec 31, 2025 纪要生成: 2026-06-29


全集重点


嘉宾/话题简介

Jeff Beck 博士是一位在数学和计算神经科学领域有着深厚背景的研究者。他拥有西北大学的数学博士学位,主要研究复杂系统中的模式形成。在本期播客中,他基于“贝叶斯大脑”假说,深入探讨了人类认知、因果推理的本质,并对当前人工智能发展的关键驱动力、局限性以及通往更高级智能的路径提出了独特见解。他目前致力于构建一个受认知启发的、可扩展的框架,用于开发具备对象中心世界模型的AI。


分节详述

贝叶斯推理、科学方法与人类行为

本节重点

详细精要

💬 精华片段(中文)

“贝叶斯推理为我们提供了一种规范性的经验探究方法,并在很大程度上封装了科学方法。” “Basian inference provides us with like a normative approach to empirical inquiry and encapsulates the scientific method at large.”


计算隐喻、因果模型与宏观世界

本节重点

详细精要

💬 精华片段(中文)

“因果模型的美妙之处在于,它减少了你需要担心和追踪的变量数量。这就是拥有一个原因的美妙之处。” “The nice thing about a causal relationship, it reduces the number of variables you have to worry about and track. That's the beauty of having a cause.”


主动推理、AutoGrad与AI的历史转折

本节重点

详细精要

💬 精华片段(中文)

“我认为最大的事件是自动微分……它把AI开发变成了一个工程问题。” “I think that the biggest thing was autograd right and autograd turned um the development of artificial intelligence um from being something that was done by like carefully constructing your neural networks… and they turned it into an engineering problem.”


构建具身智能:对象中心的世界模型与系统工程

本节重点

详细精要

💬 精华片段(中文)

“我们希望构建对象中心、动态、因果的模型……这是巨大的差异。” “We want to build models that are... object-centered. It's dynamic. It's a it's largely causal, right? Um it's, you know, that's that's that's the big difference.”


主动推理的现状、可扩展技术与架构设想

本节重点

详细精要

💬 精华片段(中文)

“如果你有一个明确的对象中心模型,你最终得到的不是一个理解房子的模型,而是成千上万个小模型,每个都解释了房子内的一个物体或物体类别。” “If you have an explicitly object-centered model then you end up not just with one model that understands a house. you end up with one model that's actually thousands and thousands of little models each of which... sort of explains like a single object or object class within the house.”


从游戏引擎到现实世界、深度学习融合及AI对齐

本节重点

详细精要

💬 精华片段(中文)

“我们如何解决这个问题?作为人类,我们是通过交流信念来解决的。……当我们每个人对对方的信念形成机制有了非常合理的模型,那时唯一的分歧原因就是奖励函数上的分歧。” “The way that we solve this problem as people is we talk about our beliefs. ... each of us has a very reasonable model of the belief formation mechanism that the other person has at which point the only cause for disagreement is a disagreement about the reward function.”


涌现、程序合成与人类未来的角色

本节重点

详细精要

💬 精华片段(中文)

“我觉得有趣的不是复杂事物能从简单局部规则中产生……我感兴趣的是,那些产生的大尺度对象的属性是什么?” “What I find interesting though isn't the fact that like complicated stuff can result from like simple local rules. What I find interesting is like well what are the properties of the resulting large scale objects?”


专业术语注释

术语 解释
贝叶斯推理 (Bayesian Inference) 一种基于贝叶斯定理,通过结合先验知识和新数据来更新对某一假设的置信度的统计推断方法。在播客中被视为封装了科学方法的规范性框架。
狄利克雷过程先验 (Dirichlet Process Prior) 一种在非参数贝叶斯模型中使用的先验分布,常用于聚类问题,允许潜在簇的数量随数据增长而增长。
中国餐馆过程 (Chinese Restaurant Process) 狄利克雷过程的一种形象化比喻,用于描述新数据点加入已有簇或形成新簇的概率过程。
可供性 (Affordances) 环境提供给动物的、可以被其利用的行动可能性。在播客中,指一个智能体在当前环境下能够执行的、并能导致预期结果的干预行为。
马尔可夫模型 (Markov Model) 一种统计模型,其核心假设是下一状态的概率仅取决于当前状态,而与更早的历史无关。在此用于比喻引入动量变量后如何简化计算。
向下因果关系 (Downward Causation) 指一个系统的宏观状态对其微观组成部分施加因果影响的假设。Jeff将其作为判断宏观变量是否合理和系统行为是否“涌现”的一个关键实用标准。
主动推理 (Active Inference) 卡尔·弗里斯顿提出的理论框架,将感知、学习和行动统一在最小化自由能(即最小化意外或不确定性)的原则下。
自动微分 (AutoGrad) 一种自动计算函数梯度的技术,是深度学习框架(如TensorFlow, PyTorch)的核心。它使得开发人员无需手动推导和实现反向传播的复杂方程,将AI开发转变为工程问题。
Mamba 一种基于状态空间模型的神经网络架构,被视为Transformer的有力竞争者。Jeff用它来证明大规模扩展,而非Transformer特有的注意力机制,才是能力提升的关键驱动力。
归一化流 (Normalizing Flow) 一种生成模型,通过一系列可逆变换将一个简单的分布(如高斯分布)转化成复杂的分布。Jeff指出扩散模型是其一种特殊的训练方式。
自然梯度 (Natural Gradient) 一种优化方法,它考虑参数空间的几何结构(使用费舍尔信息矩阵),而不是像标准梯度下降那样假设其是欧几里得空间,从而能更高效地进行参数更新。
坐标下降 (Coordinate Descent) 一种优化算法,每次迭代只沿着一个坐标方向寻找函数最小值,而固定其他坐标不变。
专家轨迹学习 (Expert Trajectory Learning) 一种让机器人通过模仿人类专家的操作行为(轨迹)来学习技能的方法,如模仿人类将杂货放入冰箱的动作。被Jeff视为一种未能让机器人理解底层物理世界的方法。
程序合成 (Program Synthesis) AI领域的一个分支,目标是自动生成满足用户指定意图(通常是输入输出样例)的计算机程序。

延伸思考

  1. 可扩展的贝叶斯 vs. 不可解释的深度学习:如果“大量小模型”的贝叶斯框架能实现同等级别的智能,其显式的、可解释的对象表征是否会比深度学习大模型在安全关键领域(如医疗、法律)具有压倒性优势?
  2. 模拟到现实的“最后一公里”:Jeff强调模拟器需要“足够好的物理”,但这本身就是个难题。如何界定物理真实度的“足够”门槛?这是否意味着我们要先构建一个完美的世界模拟器,然后才能在其内部训练出实用的物理世界AI?
  3. 关于涌现的认知偏见:Jeff尖锐地批评了基于“人类预测能力不足”下的涌现定义。这引出一个问题:如果一个现象因为计算不可约而确实无法提前预测,我们该如何区分“真正的因果涌现”和“基于计算能力的无知”?
  4. AI对齐的“信念交谈”在不可信AI上的应用:如果AI系统是纯粹的黑盒,其输出的“信念解释”本身可能就是为了最大化奖励函数而编造的谎言。在这种场景下,Jeff的对话式对齐方案是否完全失效?
  5. 人类价值的特殊性:在“一切皆由机器完成”的未来,将人类价值归结为“独特的目标体系”是否过于简化?如果人类的欲望也可以通过逆向工程或优化被理解和操纵,人类是否还能保持其独特性?

原文发表:Dec 31, 2025  ·  纪要生成:2026-06-29