▶ 原文链接

AI 赋能科学突破与生成式 AI 的热力学本质 - 对话 Max Welling

来源: YouTube (The Information Battle Neck) | Max Welling | May 28, 2026 分类: 其他 原文发表: May 28, 2026 纪要生成: 2026-06-25


全集重点


嘉宾/话题简介

Max Welling 是阿姆斯特丹大学机器学习教授、CuspAI 的联合创始人兼 CTO。他曾在 Qualcomm 担任 VP,并任职于 Microsoft。作为图神经网络、等变模型和贝叶斯深度学习领域的先驱,Max 拥有理论物理博士学位背景。本期播客探讨了从基础模型 scaling law 的局限性、材料科学与气候变化的物理实践,到他最新著作中揭示的“生成式 AI 热力学”这一深刻洞察。


分节详述

00:00 AI 现状与缺失的板块

本节重点

详细精要

💬 精华片段(中文)

“我们似乎在接近通用人工智能……但如果你看到效率上的巨大差异,在同样智能水平下,人类和当前硬件的能效有时差了 6 到 8 个数量级。我认为我们还有很多令人兴奋的东西等待发现,或许在我们把数据中心送上太空之前,可以先研究一下人脑是如何创造智能的。”

"We are edging in on artificial general intelligence... But if you see the enormous difference like... between six and eight orders of magnitude difference in terms of efficiency energy efficiency for the same amount of intelligence between humans and current hardware... we could also study the human brain and figure out... how it creates intelligence, which apparently is a very different paradigm than the current hardware."


06:15 机器学习的科学适用性与脱域问题

本节重点

详细精要

💬 精华片段(中文)

“最核心的是数据可用性……气象学家存储了拍字节级的数据,这使得它成为机器学习的绝佳靶标。现在的天气预测模型比传统的偏微分方程数值积分器快上4个数量级。”

"The most important thing is that the data needs to be available... meteorologists have just stored their data literally petabytes of data available... that makes it a huge successful target... models out there which predict the weather... like four orders of magnitude faster than PDE numerical integrators."


12:02 验证器、强化学习与材料发现的新范式

本节重点

详细精要

💬 精华片段(中文)

“这很明确,因为那样你就能应用强化学习……如果拥有一个简单的方法来验证材料是否符合你所有的需求,你就能改进你的生成模型去创造更好的分子。”

"That's clear because then you can apply reinforcement learning... if you have an easy way to verify whether the material satisfies all the properties that you want, you can then improve your generative models to make better molecules."


16:42 物理世界的“摩擦力”:连接虚拟与湿实验室

本节重点

详细精要

💬 精华片段(中文)

“然后你会发现,嘿,我需要买一些前驱体材料,我得去订货,可能要等上几个月才拿到。然后你又发现需要一台新仪器,那可能要等两年才能到货。一切都极大地减缓了。”

"And then you figure out, hey I need to actually buy precursor materials... I have to order them and it takes maybe a few months before you have them and then you figure out I need a new machine and it actually takes two years to get it. So everything slows down tremendously."


23:04 主动学习、基础模型与科学发现的通用抽象层

本节重点

详细精要

💬 精华片段(中文)

“你将得到一个化学领域的母舰级基础模型……但当你深入到某个特定的材料类别时,你会发现这些模型并不完全理解它们……你会进入一个主动学习闭环,找出正确的数据点,为这个特定的材料类别微调你的模型。”

"You'll get like a mother ship of all foundation models for all of chemistry... but if you dive into a particular subclass of problems... these models do not completely understand these new materials... you will then have to go through an active learning loop to find the right data points to fine-tune your models for that particular material class."


30:24 量子力学、世界模型与归纳偏置的博弈

本节重点

详细精要

💬 精华片段(中文)

"如果世界真的是三维的,具备对称性,我旋转头部物理定律不变……那么为什么不把这些原本就知道的先验知识放进去呢?在我看来,这是一个不需要动脑子就能做出的决定。”

"The fact that the world is three-dimensional... has symmetries like if I rotate my head the physics of the world don't change... why would we not put them in because we already know these things... to me seems like a no-brainer."


43:23 使命感驱动的 CuspAI:气候危机下的科学解法

本节重点

详细精要

💬 精华片段(中文)

“在碳中和之后,我们需要面临一个世纪的、每年从大气中移除约200亿吨二氧化碳的任务……如果我们不想把这个难题和成本推给子孙后代,我们现在最好就开始着手解决。”

"After that there is a century of removing carbon dioxide from the atmosphere at about 20 gigatons a year... if we don't want to push that problem and the cost of that problem to the future generations... we'd better work on this now."


56:52 新书推荐:《生成式 AI 与随机热力学》

本节重点

详细精要

💬 精华片段(中文)

“人们发现这两个领域的数学内容几乎完全相同……我们有变分自由能,在机器学习里我们也有变分自由能,也就是证据下界 (ELBO)。这能实现交叉授粉,这让我着迷。”

"I found that the mathematics between those two are actually almost identical... we clearly have a variational free energy... and in machine learning we also have a variational free energy which is the ELBO evidence lower bound... now you can cross fertilize... I find that fascinating."


01:10:30 ICLR 2026 前瞻与 Max 的寄语

本节重点

详细精要


专业术语注释

术语 解释
AGI 通用人工智能。Max 认为这个概念很模糊,如果按图灵测试标准,现有大模型已经非常接近。
Physical AI / Embodiment 具身智能/物理 AI。指搭载在机器人实体上,能与物理世界交互的智能形态。Max 视其为迈向更高级智能和获取新数据的核心方向。
DFT (Density Functional Theory) 密度泛函理论。材料化学中广泛使用的一种量子力学近似方法,用于计算材料结构能量,是生成仿真数据的“兵工厂”。
ML Force Fields 机器学习力场。利用图神经网络(GNN)和等变性学习的原子间作用力场,比传统的 DFT 计算快得多,是其廉价替代品。
GNN (Graph Neural Networks) 图神经网络。在分子和材料科学中,常用于表示原子及其化学键连接,是 Max 开创的关键技术之一。
Equivariance 等变性。重要的归纳偏置,保证当分子旋转或平移时,模型给出的预测(如力)会对应变化,极大地降低了所需的数据量。
Wet Lab 湿实验室。指需要处理各种化学试剂和物理设备,进行真实实验的实验室,与纯计算机仿真/数字环境相对。
Active Learning 主动学习。模型按某种策略自动筛选出最有标注价值的数据点,打上标签后再利用它们训练,常用于昂贵的数据(实验/仿真)生成场景。
Foundation Model 基础模型。在此语境下指化学/生物领域通用的“母模型”,能够编码任何材料的隐空间特征,但处理极端泛化时仍需微调。
World Models 世界模型。Yann LeCun 推崇的架构,Max 极度认同,指将通过常识(几何、物理)所感知的硬编码先验融入 AI,帮助其理解世界规则并进行推理和规划。
Scaling Laws 规模法则。指通过增加模型参数/数据/算力就能直接无损提升模型能力的法则。Max 认为这虽然在资料科学里也存在,但有天花板。
Direct Air Capture 直接空气捕获。从极稀薄的大气中提取和封存二氧化碳的技术。这是 CuspAI 当前聚焦攻克的气候核心问题。
Stochastic Thermodynamics 随机热力学。研究对象为非平衡态下,包含微小(随机)粒子的物理系统中的能量和信息交换。Max 新书认为它和生成 AI 背后的原理相同。
ELBO 证据下界(物)。生成模型(如 VAE 和扩散模型)的核心优化目标。Max 证明其在物理中直接对应变分自由能。

延伸思考

原文发表:May 28, 2026  ·  纪要生成:2026-06-25