Max Welling 主题演讲：AI 如何变革科学

来源： YouTube | Max Welling | Nov 18, 2025 分类： 其他 原文发表： Nov 18, 2025 纪要生成： 2026-06-25

全集重点

自由能原理统一物理学与AI：演讲用能量与熵这两个核心概念，类比工业革命和当前的AI革命，说明AI在科学中的角色本质上是在降低信息熵，从有限数据中榨取最大化价值。
仿真到仿真的仿真（Emulation）是核心范式：AI在科学中的杀手锏应用是训练神经网络来模拟昂贵的物理模拟过程，从而实现万倍加速，这种范式转变正在重塑气象、化学、材料等多个领域。
气象预报已实现大规模降维打击：摒弃传统物理方程，直接利用海量数据训练Transformer或图神经网络，不仅预报精度和数值求解器相当，速度更提升10000倍，且能跨域迁移（如用污染数据微调）。
分子模拟进入等变力场时代：通过在神经网络中嵌入物理对称性（等变性），机器学习力场以接近量子力学精度、经典力场速度运行，催生了生成式分子设计，可按需生成具有特定性质的药物或材料。
直接空气碳捕集的技术经济挑战：为应对气候危机，演讲者创立CuspAI，利用AI设计金属有机框架（MOF）等纳米多孔材料以低成本直接捕获大气中的二氧化碳，并构建了从生成-评估-系统集成-技术经济学的全栈平台。

嘉宾/话题简介

Max Welling 是机器学习领域的知名科学家，曾任微软研究院杰出科学家、阿姆斯特丹大学教授。他在等变神经网络、图神经网络和变分自编码器等领域做出了开创性贡献。本演讲系统阐述了他对“AI for Science”大趋势的深刻洞察，从基础物理学原理出发，连接AI核心概念，并深入探讨了AI在流体力学/气象预测和分子动力学/药物设计两大领域的革命性应用，最后分享了他因此创立气候科技公司 CuspAI 的初衷与实践。

分节详述

[00:00] 自由能：连接物理学与AI革命的统一原理

本节重点

物理学中的自由能与机器学习中的变分下界（ELBO）原理相通，是连接两个领域的数学桥梁。
工业革命本质是释放了能量，而AI革命在本质上是在降低熵，即更好地利用隐藏信息。
熵在物理学和信息论中都代表信息缺失，机器学习中的隐变量模型正是这一概念的体现。

详细精要

自由能公式的普适性：能量（Energy）减去熵（Entropy）是物理学中统计力学的核心方程，同时也是机器学习中变分自由能（或称证据下界ELBO）的基础。这表明两个领域在最深层的数学结构上是一致的。演讲者正在撰写一本相关书籍，旨在帮助社区理解统计学与AI之间的这种深层联系。
能量与工业革命的类比：能量代表做功的能力，大约在1820年蒸汽机发明引发的工业革命中，人类开始用机器能量替代人的能量（或畜力）。这是将公式中的“能量项”进行了彻底的变革，极大地拓展了人类社会的生产力边界。
熵的深刻内涵与AI革命：
玻尔兹曼的悲剧：熵的概念由玻尔兹曼引入物理学，因其过于深刻而在当时不被理解，导致研究者本人抑郁。熵本质上是信息的缺失，是因无法获取系统所有微观自由度的信息，而无法将全部能量转化为有用功的量度。
机器学习中的熵：AI革命对应的是公式中的“熵项”。在机器学习中，隐变量模型（Latent Variable Models）正是这一概念的实践，我们用概率分布来描述观察不到的隐状态，这本身就是一种信息缺乏的表现。
AI的根本目的：当前的AI革命，其核心在于降低熵，即从已有的数据（通过实验、模拟投入能量所获得）中，通过学习最大化地提取信息，从而更好地理解和预测那些隐藏的自由度。

💬 精华片段（中文）

“能量是做功的能力...在工业革命中，能量项从人力能量转变为机器能量...而当前的AI革命，影响的是熵的部分，它在做的事是降低熵。” "The energy is our ability to do work... and in the industrial revolution we started to replace human labor with machine labor... the current AI revolution... affects the entropy part of the equation and it decreases the entropy."

[05:13] AI变革科学的核心范式：从模拟到仿真（Emulation）

本节重点

传统科学研发流程基于物理学家讨论、设计实验、然后进行昂贵实验的循环。
新范式通过用计算机模拟分子等物理过程，大幅减少实验室物理实验的次数。
更关键的一步是仿真（Emulation）：用模拟产生的数据训练AI模型，直接预测下一次模拟的结果，实现对模拟本身的万倍加速。

详细精要

传统科学R&D范式的痛点：旧有模式是科学家团队阅读论文、讨论，然后决定做一个实验，每个实验成本高达5万到10万美元。数据分析后，再开始下一轮思考和实验设计。这个循环耗时长、成本高、效率低。
范式转变：基于模拟的计算科学：
新范式是利用强大的算力和AI工具，在计算机中尽可能多地完成“实验”，例如通过求解薛定谔方程来逐个分子地模拟其量子力学行为，从而读取材料属性。
这种模拟能够为下一步真实的物理实验提供高价值的信息，从而精准地设计实验，减少实验次数，大幅削减实验间的等待时间。
范式飞跃：从模拟（Simulation）到仿真（Emulation）：
概念解释：以药物公司设计分子为例，如果在计算机上模拟分子A后得到结果不理想，传统做法是修改得到分子B，再重新跑一次昂贵的模拟。而“仿真”则是将分子A的模拟数据存入数据库，训练一个神经网络来预测分子B的模拟结果。这相当于 “对模拟的模拟”。
核心价值：AI仿真模型不仅比真实实验快，甚至比原本的计算机模拟还要快得多。这种做法完美体现了“降低熵”的理念：我们在模拟中投入了大量的计算能量，而通过存储数据和训练ML模型，我们从投入的“功”中获取了最大量的信息，并在未来绕开了实际的模拟计算。
时代机遇：这一革命大约在五年前开始，演讲者认为现在仍处于早期，蕴藏着巨大的机会。

💬 精华片段（中文）

“我们应该把第一次实验的数据存起来，训练一个神经网络来预测下一次实验的结果...这个过程叫仿真，一种用AI工具对模拟进行的模拟。我们在试图降低熵，从我们投入的功中学到尽可能多的东西。” "We should store the data from the first experiment in a database and train a neural network to predict the outcome of the next experiment... that process is emulation, the simulation of a simulation... we are trying to reduce entropy, to really learn as much as we can from the work we put in."

[10:58] 成功案例一：AI颠覆气象预报——从物理方程到大数据黑箱

本节重点

NVIDIA在2016年左右率先使用GPU和大量气象数据，抛开物理方程，直接训练神经网络预测全球天气。
早期受到气象学家的普遍质疑，但在两年内，数据驱动的AI模型展现了惊人的效果。
AI模型不仅预测效果与传统数值求解器相当，而且速度提升了10000倍，让气象学家彻底信服。
Aurora 模型展示了强大的跨域迁移能力，用高/低分辨率混合数据训练，并可微调到空气污染预测上。

详细精要

AI气象的起点与数据优势：
大约在2016年，NVIDIA 发表了一篇论文，利用GPU来处理全球天气数据。地球大气被划分为100公里 x 100公里 x 25公里的体素，每个体素内包含温度、压力、风速等物理量。
气象学家几十年如一日地收集数据，累积了PB级别的公开可用数据。在数据充足的地方，机器学习就有很大机会造成冲击。
方法论的完全转变：“忘掉物理学”：
早期的探索如NVIDIA的模型，以及后来的 Pangu-Weather（华为，基于Transformer）和 GraphCast（DeepMind，基于消息传递算法），都不约而同地选择了抛弃传统的偏微分方程（PDE）数值求解器，直接将天气预测看作一个基于海量数据的视频预测任务。
这证明了，只要数据量足够大，使用何种具体的AI架构（Transformer、GNN等）在性能上差别不大，都是“巨型黑箱神经网络”。
从被质疑到被颠覆的行业心态：
演讲者在微软研究院与英国气象局合作时，起初气象学家对AI方法极度怀疑，他们认为自己在这个领域耕耘了百年，外人不可能轻易改变。
转折点：仅仅两年后，AI模型的预测能力已不亚于甚至优于传统数值求解器，但其推理速度却是后者的10000倍。这一巨大的效率跃升彻底打开了气象学家们的眼界，他们不仅从怀疑转向接受，甚至开始主动发表论文证明AI模型的有效性。
前沿模型Aurora的创新：
演讲者参与开发的Aurora模型的创新在于其泛化能力。它可以在一个统一的模型中同时接受来自欧美的高分辨率数据和非洲的低分辨率数据，并利用学到的共享表示来对非洲地区进行高分辨率预测。
更令人惊叹的是，他们用少量的NOx或NO2空气污染数据对这个气象基础模型进行微调，就能在空气污染预测问题上取得非常强的结果，表明模型内部学到了某种可迁移的物理表征。

💬 精华片段（中文）

“他们说，‘我们做这个都一百年了，你不可能用机器学习就改变我们的领域’...但仅仅两年后，这些模型不仅预测得更好，而且速度快了一万倍，这真正让他们开了眼界。” "They would say, 'We've been doing this for a hundred years, you're not gonna come in with a machine learning model and transform our field'... after two short years these models were better in predicting and 10,000 times faster, which really opened their eyes."

[16:06] 成功案例二：分子世界的AI革命——等变性、力场与生成式设计

本节重点

分子科学是AI变革科学的另一个巨大战场，因为几乎所有宏观物质都由分子组成，操控分子意味着能设计万物。
分子模拟的难点在于，原子核的运动是经典的，但其受力却由量子力学的电子云决定，导致计算极其昂贵。
等变图神经网络通过将分子的物理对称性（旋转等）直接编码进模型，极大提高了数据效率，催生了强大的机器学习力场。
结合扩散模型等生成式模型，AI不仅能模拟分子，还能按需“生成”具有特定性质的全新分子，实现逆设计。

详细精要

分子科学的巨大机遇：
在人类生活的能量尺度上，除了引力、电磁力等少数例外，万事万物均由分子构成。如果能够精准预测和操控分子，就能设计出定制化的材料。
应用场景广泛：设计治疗未解疾病的药物、提高效率的光伏材料、减少摩擦（全球20%热量因摩擦损失）的润滑剂、在更低能量下驱动反应的催化剂、合成肥料时减少碳排放的固氮过程（当前哈勃法占全球碳排放5%），以及用于直接空气碳捕集的新材料。
分子模拟的物理复杂性：
分子的运动看似简单，遵循牛顿第二定律（F=ma），但核心难题在于计算原子核之间的力。
这个力主要由围绕在分子周围的电子云决定。由于电子极其微小，必须用量子力学（1925年由海森堡等人创立）来描述，即求解薛定谔方程。精确求解的计算量随电子数呈指数级增长。
尽管出现了如密度泛函理论（DFT） 等良好的近似方法（计算复杂度降至电子数的立方量级），并因此获得诺贝尔奖，但由于分子系统本质上是混沌且非线性的，长时间的动力学演化依然极其困难，这个过程复杂到需要用概率分布来描述初始条件。
关键AI技术一：等变性与图神经网络
数据效率瓶颈：直接训练AI预测分子受力面临数据昂贵的问题。如果一个模型不理解“旋转分子不会改变其能量”这一基本物理事实，它会将每一帧旋转后的分子视为全新的数据，效率极低。
等变性（Equivariance）：核心思想是将物理对称性构建到神经网络中。例如，先移动输入再卷积，应与先卷积再移动的效果一致。这意味着模型的预测会随着输入分子的旋转而相应地旋转。
技术路径：从Thomas Kipf 等人的早期工作开始，将卷积操作从规则网格推广到图上（分子天然可以用图表示），再到要求这个图神经网络对旋转操作也具备等变性。这就构建出了对分子力场预测极为理想的模型结构。
系列工作：演讲者实验室的Taco Cohen、Maurice Weiler 等人在此领域做出了开创性贡献，Weiler 的博士论文是该领域的标志性著作，内容从入门到高阶，全面且开源。
机器学习力场（ML Force Fields）的地位：
这是一个目前规模巨大的产业，演讲者预测未来将有诺贝尔奖授予此领域。
它填补了速度最快但精度低的经典力场和精度极高但仅限小分子的量子DFT之间的空白。它在速度和精度之间取得了绝佳的平衡。
最近的模型，如Meta公司的 UMA 和 Equiformer 等，在广泛的化学空间内都表现出非常精准的性能。

💬 精华片段（中文）

“如果你不把对称性（例如旋转）构建到模型里，模型就不懂这一点，它会把每个朝向都当成一个全新的分子。这会非常、非常数据低效。” "If you don't build this symmetry into your models, your model will not understand it and it will treat every orientation as an entirely new molecule. It's very, very data inefficient."

[26:03] 生成式AI：从生成图像到设计分子

本节重点

早期的变分自编码器（VAE） 使用编码器-解码器结构，其目标函数正是证据下界（ELBO），即自由能。
2015年的扩散模型灵感源自非平衡热力学，通过添加和去除噪声的随机过程生成了高质量图像。
这种生成式AI的思想可以无缝迁移到分子设计上，例如给定目标属性（如抑制某蛋白），模型可以从噪声中生成一个能嵌入该蛋白口袋的药物分子。

详细精要

从VAE到扩散模型的热力学之旅：
VAE（变分自编码器） 建立了一个从数据到隐空间再反向生成的联合概率模型，其优化目标是使两个方向的联合概率分布尽可能一致，这个目标度量就是ELBO，即自由能。但VAE生成的图像通常比较模糊。
2015年，Jascha Sohl-Dickstein 等人的论文“基于非平衡热力学的深度无监督学习”提出了一个新思路：不要只加一次噪声，而是加一系列随机层。这形成了一个从有序分布到无序噪声（平衡态）的正向过程。
从这个角度看，编码器端对应一个走向热力学平衡的过程，而学习逆转这个过程（解码）则相当于对系统做功以降低其熵，使其重新结构化。后来的研究将这一过程形式化为随机微分方程（SDE），大幅提高了采样效率，形成了如今强大的扩散模型。
从生成狗的图像到生成救命药物：
扩散模型的成功令人兴奋，但演讲者思考的是，与其生成“雪地里玩耍的狗”，不如用它来做点真正有用的事：生成分子。
原理是相同的：可以从带有目标属性条件的噪声开始，通过逆向扩散过程，逐步“生成”出具有近似所需性质的化学分子。这为按需设计药物、材料提供了可能。
DiffLinker案例：演讲者实验室的工作 DiffLinker 演示了这一能力的强大之处——该模型能生成出一个可以恰好放入特定蛋白质口袋（靶点） 的类药分子，这是理性药物设计的一次范式进步。

💬 精华片段（中文）

“与其生成雪地里的狗，我们能做些有用的事吗？事实证明，你也可以生成分子...你可以从噪声开始，加上你想要的属性，然后生成具有近似那些属性的分子。” "Instead of cute dogs in the snow, can we actually do something useful? It turns out you can also generate molecules... start from noise, possibly with properties you like, and then generate molecules that have approximately those properties."

[30:12] 创业实践：CuspAI与应对气候危机的材料设计平台

本节重点

演讲者创立 CuspAI 的初衷源于气候危机：科学家预测，在2050年实现净零排放后，仍需在后续一个世纪里进行负排放。
直接从浓度为0.04% 的大气中捕获二氧化碳（DAC）是一个熵变驱动的巨大能量挑战，其理论能耗下限极高，导致当前技术成本过于昂贵。
CuspAI的目标是建立一个AI驱动的材料设计平台，在金属有机框架（MOF） 等纳米多孔材料领域实现端到端的逆设计，以大幅降低碳捕集成本。

详细精要

创业动机与气候科学的严峻现实：
演讲者从气候科学家处了解到，即使未来几年全球达到净零排放，自1764年蒸汽机发明以来在大气中积累的CO2并不会消失。
负排放时代：从约2015年起的之后一个世纪里，人类必须开始从大气中大规模抽取CO2，速率将高达每年200亿吨，相当于每年移除一个日内瓦湖（Lake Geneva）大小体积的液态CO2，持续50到100年。而目前实现这一目标的技术不存在或成本极高。
直接空气碳捕集（DAC）的自由能分析：
这个问题可被很好地用自由能公式进行框架分析。分离CO2的最低能量消耗，可以通过计算 CO2与空气充分混合状态 与 CO2被分离出状态 之间的熵变来求得。
计算结果显示，由于CO2在大气中的浓度极低（0.04%），理论上最小能耗约为550兆焦耳/吨。即使在这个理论下限，所需总能量也占到当前全球总能耗的5%。
而实际的工程效率必有损失，更现实的能耗可能占到全球总能耗的50%，这是一个数万亿美元的惊人成本。由于大气是 “公地悲剧” 的典型，缺乏让污染者付费的机制，因此解决问题的思路只有两条：要么由政府让排放更昂贵，要么由技术人员让碳移除成本更便宜。
CuspAI的解决方案与战略：
公司定位：CuspAI在一年前成立，已获得可观投资，目前团队约27人，在剑桥、柏林、东京等地设有办公室，研究领域涵盖碳捕集、水净化/污染物去除、电池和半导体。
核心平台：正在构建一个“材料设计搜索引擎”，分为三大部分：
1. 生成式AI（Generative Model）：用以生成数百万计的候选材料。目前聚焦于金属有机框架（MOF），这是一类具有规则纳米孔洞的巨大晶体结构，非常适合捕获气体分子。
2. 多尺度属性评估（Property Evaluation）：利用计算化学工具对不同精度的物理性质进行评估，例如专门为巨正则蒙特卡洛模拟开发的工具，用以评估材料对CO2的实际捕获能力。
3. 协调智能体（Orchestration Agent）：居于核心，决定何时生成、何时评估、以及用何种精度进行评估，从而高效地导航几乎无限的化学空间。
最终愿景：打造一个搜寻所有可能材料的引擎。用户可以提出“我需要一个具有某种性质的材料”，平台便能源源不断地输出符合要求的候选物，这将带来一场前所未有的材料设计革命。

💬 精华片段（中文）

“这是一场公地悲剧。我们可以免费使用大气，免费污染它，没有人为此买单...我们能做的，要么是让排放更贵（政治家的事），要么是让移除二氧化碳更便宜（我们技术人员的事）。” "The atmosphere is a typical tragedy of the commons. We can all use it for free, we can pollute it for free, nobody pays the bill... One thing we can do is make emissions more expensive... or we can make the removal of carbon dioxide cheaper. And that's for us guys, the technicians."

[39:29] 问答环节

本节重点

问题一：分子可合成性与现实落地的挑战：AI设计的分子必须能够被制造、用于实际流程、并具备商业可行性。
问题二：小数据集下代理模型的有效性：当数据稀缺时，可引入物理对称性等归纳偏置，并必须采用贝叶斯方法量化预测不确定性。

详细精要

问题一：关于AI发现分子的可复现性和全链路挑战（提问者：Chopan Taga）
- 现实鸿沟：从发现一个分子到它在工厂里被真正使用，中间还有合成路径、规模化生产、系统集成、市场接受度等一系列巨大挑战，这仅仅是万里长征走了一半。
- CuspAI的全栈建模方法：为了应对这个问题，CuspAI不仅仅对分子本身建模。他们的平台还会对该分子将要运行其中的宏观碳捕集设备（反应器） 进行建模，这涉及到另一套偏微分方程（PDEs）。
- 技术经济模型：模型还会进一步评估技术经济学（Techno-Economics），即综合考量成本、寿命、维护等因素，判断该技术是否具备商业可行性。平台最终会对这些下游指标进行联合优化，从而从一开始就筛选出具备全流程价值的材料。
问题二：关于稀疏或不完整数据下替代模型的有效性（提问者：Olui）
- 贝叶斯视角：演讲者建议始终采用贝叶斯方法。有数据总比没数据好，关键在于模型必须能给出预测的不确定性。
- 策略：当模型的不确定性太大时，就说明需要生成更多数据来降低不确定性；如果不确定性在可接受范围内，就足以指导当前决策。
- 应对措施：数据集规模从数万到十万级别时模型性能会有巨大提升，但小数据集是挑战。应对方法包括：
  - 引入归纳偏置（Inductive Biases）：例如在模型架构中强行嵌入物理对称性（如等变性），能有效提升数据使用效率。
  - 融入物理知识：将已知的物理方程信息加入模型。
  - 量化不确定性：必须清晰地知晓模型预测的置信度，这是基于模型进行决策的前提。

💬 精华片段（中文）

“你必须在你的平台中对所有这些下游环节进行建模...一旦你把这些都模型化了，你就可以在平台上为此进行优化。” "We model all of that also in our models... once you have modeled all these things you can then also optimize for them in your platform."

专业术语注释

术语	解释
自由能（Free Energy）	统计力学核心概念，公式为能量减去熵。在本语境中，它既是物理系统做功能力的度量，也是机器学习中ELBO目标的物理对应，完美连接了物理学和信息论。
熵（Entropy）	代表系统无序程度或信息缺失的度量。在AI中，它代表模型对隐变量等未知因素的不确定性。AI革命的目标之一就是通过学习来降低它。
证据下界（ELBO）	变分推断中的优化目标，全称为Evidence Lower Bound。它是变分自由能，在VAE等生成模型中用于最大化数据似然的下界。
仿真（Emulation）	在科学计算中，指用训练好的AI模型去预测另一个复杂的物理模拟（如量子力学计算）的输出。它比原始模拟快几个数量级，是实现高通量筛选的基础。
等变性（Equivariance）	神经网络的一种性质：当输入发生某种变换（如旋转）时，输出也会发生相同方式的变换。在分子建模中构建等变性，能让模型天然理解物理对称性，极大提高数据效率。
图神经网络（GNN）	一种能处理图结构数据的神经网络。分子可以自然地表示为一个图（原子为节点，化学键为边），因此GNN是分子建模的核心工具。
密度泛函理论（DFT）	一种求解多电子体系薛定谔方程的近似方法，是计算化学的主力工具，计算复杂度为电子数的立方，获得了1998年诺贝尔化学奖，但其成本仍限制了可用于模拟的体系大小和时间尺度。
扩散模型（Diffusion Models）	一类受非平衡热力学启发的生成式模型。它通过前向过程向数据逐渐添加噪声，再学习一个逆向过程来从噪声中重建数据，在图像和分子生成等领域效果显著。
直接空气碳捕集（DAC）	Direct Air Capture，一种直接从环境空气中捕获二氧化碳的技术。本演讲指出，其核心挑战源于空气中CO2极低的浓度（0.04%），导致分离过程的熵变巨大，能耗和成本极高。
金属有机框架（MOF）	Metal-Organic Frameworks，一类由金属离子和有机配体构成的多孔晶体材料，具有超大比表面积和可调节的孔道结构，被认为是气体吸附和分离的理想候选材料。

延伸思考

可合成性与可规模化之墙：AI可以生成海量的虚拟分子，但从屏幕上的分子结构到试管里合成出来，再到吨级规模化生产，物理和化学上的约束构成了巨大的鸿沟。“可合成性”本身正在成为一个重要的AI预测目标，但如何与生成模型形成真正的闭环仍是一个核心难点。
“完全抛弃物理学”与“融入物理学”的权衡：演讲中提到了两个极端的成功案例。气象领域几乎完全用数据驱动的黑箱取代了传统物理方程，而分子领域则通过等变性、图网络等将物理先验严格编码进模型。未来科学AI的路径是什么？哪种策略在哪个问题域更具普适性？这值得深入思考。
负排放的经济模型与伦理悖论：CuspAI的使命依赖于通过技术创新使碳移除变得更便宜。但这会不会反而降低全球碳减排的动力，形成一种“技术可以解决一切”的道德风险？正如演讲者所说，这是个“公地悲剧”和复杂的政策博弈。
非洲的AI创业生态：演讲者特别提到希望看到非洲能出现更多类似CuspAI的初创公司，利用当地人才和教育优势，同时又面临风险资本缺失的挑战。这是一个关于全球AI创新格局去中心化的重要观点，值得关注和探讨。

原文发表：Nov 18, 2025 · 纪要生成：2026-06-25