来源: YouTube (The Information Battle Neck) | Max Welling | May 28, 2026 分类: 其他 原文发表: May 28, 2026 纪要生成: 2026-06-25
Max Welling 是阿姆斯特丹大学机器学习教授、CuspAI 的联合创始人兼 CTO。他曾在 Qualcomm 担任 VP,并任职于 Microsoft。作为图神经网络、等变模型和贝叶斯深度学习领域的先驱,Max 拥有理论物理博士学位背景。本期播客探讨了从基础模型 scaling law 的局限性、材料科学与气候变化的物理实践,到他最新著作中揭示的“生成式 AI 热力学”这一深刻洞察。
本节重点
详细精要
Max 认为,与其把数据中心发射到太空,不如先研究人脑是如何产生智能的,这说明还有非常激动人心的新发现在前方,AI 领域远未终结。
具身智能是通往高级智能的必经之路:Max 明确指出,纯语言模型下一个缺失的关键部分是 Embodiment(具身化),也就是目前火热的 Physical AI(物理 AI)。
要达到某种程度的自我意识,需要让 AI 模拟人类的身体或在真实世界通过机器人进行学习。此外,纯语言数据即将枯竭,机器人平台是收集海量新数据的最佳途径。
AI 与科学的双向奔赴:Max 的个人职业生涯是从理论物理向 AI 引入物理启发,现在局势反转,AI 开始反哺科学。
💬 精华片段(中文)
“我们似乎在接近通用人工智能……但如果你看到效率上的巨大差异,在同样智能水平下,人类和当前硬件的能效有时差了 6 到 8 个数量级。我认为我们还有很多令人兴奋的东西等待发现,或许在我们把数据中心送上太空之前,可以先研究一下人脑是如何创造智能的。”
"We are edging in on artificial general intelligence... But if you see the enormous difference like... between six and eight orders of magnitude difference in terms of efficiency energy efficiency for the same amount of intelligence between humans and current hardware... we could also study the human brain and figure out... how it creates intelligence, which apparently is a very different paradigm than the current hardware."
本节重点
详细精要
利用这些数据训练的天气预测模型速度比传统的偏微分方程数值积分器快了 10,000 倍 (4个数量级),在数据分布范围内的预测甚至更准确,但一旦脱域 (Out-of-domain),问题就会出现。
仿真与实验:科学数据的来源双引擎:科学数据的来源分为两类,只要其中一条路通,ML 就能介入。
密度泛函理论 (DFT) 是化学家和材料科学家广泛使用的一种近似方法,通常效果不错,只要投入足够的算力,就能生成合理的大规模数据集来训练 ML 模型。
ML 局限性的本质:代价高昂的长尾验证:Max 指出,像化学或自动驾驶这类存在海量长尾例外情形的领域,很难通过简单的抽象来理解。
💬 精华片段(中文)
“最核心的是数据可用性……气象学家存储了拍字节级的数据,这使得它成为机器学习的绝佳靶标。现在的天气预测模型比传统的偏微分方程数值积分器快上4个数量级。”
"The most important thing is that the data needs to be available... meteorologists have just stored their data literally petabytes of data available... that makes it a huge successful target... models out there which predict the weather... like four orders of magnitude faster than PDE numerical integrators."
本节重点
详细精要
在这个闭环中,模型可以近乎自主地生成数据。但如果验证成本极其昂贵(比如验证某种量子材料的属性,无论是通过计算还是实验都既慢又昂贵),模型训练就会变得极其困难。
材料发现的计算化转折点:Max 阐述了材料学在近几年变得“可解”的三大驱动力。
💬 精华片段(中文)
“这很明确,因为那样你就能应用强化学习……如果拥有一个简单的方法来验证材料是否符合你所有的需求,你就能改进你的生成模型去创造更好的分子。”
"That's clear because then you can apply reinforcement learning... if you have an easy way to verify whether the material satisfies all the properties that you want, you can then improve your generative models to make better molecules."
本节重点
详细精要
因此,绝对不能低估操作湿实验室所需的领域专业知识和人力经验,开展需要与资深实验研究者深度合作。
CuspAI 的虚实结合架构:CuspAI 的具体做法是设计了一个闭环的 AI 智能体系统。
该架构包含两层优化:一是从廉价但粗糙的代理模型到昂贵但高精度的 DFT 仿真再到极其昂贵精确但耗时的物理实验的梯度;二是通过贝叶斯优化来协调这一系列具有不同保真度和时间成本的工具,寻找最优的实验设计。
加速实验端是未来的关键:Max 认为,当前最大的瓶颈在于实验端的反馈太慢。
💬 精华片段(中文)
“然后你会发现,嘿,我需要买一些前驱体材料,我得去订货,可能要等上几个月才拿到。然后你又发现需要一台新仪器,那可能要等两年才能到货。一切都极大地减缓了。”
"And then you figure out, hey I need to actually buy precursor materials... I have to order them and it takes maybe a few months before you have them and then you figure out I need a new machine and it actually takes two years to get it. So everything slows down tremendously."
本节重点
详细精要
在科学计算中(特别是处理昂贵的 DFT 计算时),必须在浩瀚的结构空间中寻找最有价值的数据点进行“知识蒸馏”,从昂贵的仿真模型(教师)中提炼数据来训练廉价的 ML力场(学生),这一过程天然需要主动学习来筛选数据标签。
通用科学发现闭环的抽象层:Max 认为,尽管每个科学领域看似不同,但核心的逻辑架构是可高度抽象的通用逆设计过程。
步骤 3 (多保真度评估):建立一个从廉价到昂贵的评估器栈 (Stack of Evaluators),利用贝叶斯优化来处理不同精度下的搜索,权衡成本与收益,以此决定下一步是花费 1 秒去粗略计算,还是花 1 个月去做真实实验。
基础模型的泛化壁垒:Max 预测,未来会出现一个覆盖化学全领域的母船级基础大模型 (Foundation Model)。
💬 精华片段(中文)
“你将得到一个化学领域的母舰级基础模型……但当你深入到某个特定的材料类别时,你会发现这些模型并不完全理解它们……你会进入一个主动学习闭环,找出正确的数据点,为这个特定的材料类别微调你的模型。”
"You'll get like a mother ship of all foundation models for all of chemistry... but if you dive into a particular subclass of problems... these models do not completely understand these new materials... you will then have to go through an active learning loop to find the right data points to fine-tune your models for that particular material class."
本节重点
详细精要
他特别提到,他的前导师(曾因标准模型获诺贝尔奖)正推行一种完全不同的解释。他认为,未来的高级 AI 或许有足够的创造力提出我们从未想到的新解答。
世界模型与几何先验:Max 完全赞同 Yann LeCun 的理念,支持世界模型。
在复杂推理中,几何常识至关重要。Max 举例说明人类是通过极其抽象、粗糙的“概念级”内心模拟来预测后果的(比如预测躲在树后吓唬骑车的小孩结果),这绝不是像素级的预测,而是基于常识的强大世界模型。
归纳偏置的数据规模悖论与优化挑战:针对卷积与视觉 Transformer 的对比,Max 给出了极深刻的解读。
💬 精华片段(中文)
"如果世界真的是三维的,具备对称性,我旋转头部物理定律不变……那么为什么不把这些原本就知道的先验知识放进去呢?在我看来,这是一个不需要动脑子就能做出的决定。”
"The fact that the world is three-dimensional... has symmetries like if I rotate my head the physics of the world don't change... why would we not put them in because we already know these things... to me seems like a no-brainer."
本节重点
详细精要
能源转型全景:除了碳捕获,还涉及钙钛矿太阳能光伏(叠加硅层捕捉更多波段光能)、燃料电池、新一代电池,甚至未来的可控核聚变。这些都是既重要又有趣的科学难题。
业务架构:通用平台与专用纵深:CuspAI 并不期望一个模型走天下。
💬 精华片段(中文)
“在碳中和之后,我们需要面临一个世纪的、每年从大气中移除约200亿吨二氧化碳的任务……如果我们不想把这个难题和成本推给子孙后代,我们现在最好就开始着手解决。”
"After that there is a century of removing carbon dioxide from the atmosphere at about 20 gigatons a year... if we don't want to push that problem and the cost of that problem to the future generations... we'd better work on this now."
本节重点
详细精要
热力学/生成 AI 公式对照表:
交叉授粉的未来:Max 认为,既然底层都是随机过程在信息缺失下的处理逻辑,那么热力学发展出来的工具深刻地启发下一代 AI 算法。
💬 精华片段(中文)
“人们发现这两个领域的数学内容几乎完全相同……我们有变分自由能,在机器学习里我们也有变分自由能,也就是证据下界 (ELBO)。这能实现交叉授粉,这让我着迷。”
"I found that the mathematics between those two are actually almost identical... we clearly have a variational free energy... and in machine learning we also have a variational free energy which is the ELBO evidence lower bound... now you can cross fertilize... I find that fascinating."
本节重点
详细精要
| 术语 | 解释 |
|---|---|
| AGI | 通用人工智能。Max 认为这个概念很模糊,如果按图灵测试标准,现有大模型已经非常接近。 |
| Physical AI / Embodiment | 具身智能/物理 AI。指搭载在机器人实体上,能与物理世界交互的智能形态。Max 视其为迈向更高级智能和获取新数据的核心方向。 |
| DFT (Density Functional Theory) | 密度泛函理论。材料化学中广泛使用的一种量子力学近似方法,用于计算材料结构能量,是生成仿真数据的“兵工厂”。 |
| ML Force Fields | 机器学习力场。利用图神经网络(GNN)和等变性学习的原子间作用力场,比传统的 DFT 计算快得多,是其廉价替代品。 |
| GNN (Graph Neural Networks) | 图神经网络。在分子和材料科学中,常用于表示原子及其化学键连接,是 Max 开创的关键技术之一。 |
| Equivariance | 等变性。重要的归纳偏置,保证当分子旋转或平移时,模型给出的预测(如力)会对应变化,极大地降低了所需的数据量。 |
| Wet Lab | 湿实验室。指需要处理各种化学试剂和物理设备,进行真实实验的实验室,与纯计算机仿真/数字环境相对。 |
| Active Learning | 主动学习。模型按某种策略自动筛选出最有标注价值的数据点,打上标签后再利用它们训练,常用于昂贵的数据(实验/仿真)生成场景。 |
| Foundation Model | 基础模型。在此语境下指化学/生物领域通用的“母模型”,能够编码任何材料的隐空间特征,但处理极端泛化时仍需微调。 |
| World Models | 世界模型。Yann LeCun 推崇的架构,Max 极度认同,指将通过常识(几何、物理)所感知的硬编码先验融入 AI,帮助其理解世界规则并进行推理和规划。 |
| Scaling Laws | 规模法则。指通过增加模型参数/数据/算力就能直接无损提升模型能力的法则。Max 认为这虽然在资料科学里也存在,但有天花板。 |
| Direct Air Capture | 直接空气捕获。从极稀薄的大气中提取和封存二氧化碳的技术。这是 CuspAI 当前聚焦攻克的气候核心问题。 |
| Stochastic Thermodynamics | 随机热力学。研究对象为非平衡态下,包含微小(随机)粒子的物理系统中的能量和信息交换。Max 新书认为它和生成 AI 背后的原理相同。 |
| ELBO | 证据下界(物)。生成模型(如 VAE 和扩散模型)的核心优化目标。Max 证明其在物理中直接对应变分自由能。 |