来源: YouTube | Max Welling | Nov 18, 2025 分类: 其他 原文发表: Nov 18, 2025 纪要生成: 2026-06-25
Max Welling 是机器学习领域的知名科学家,曾任微软研究院杰出科学家、阿姆斯特丹大学教授。他在等变神经网络、图神经网络和变分自编码器等领域做出了开创性贡献。本演讲系统阐述了他对“AI for Science”大趋势的深刻洞察,从基础物理学原理出发,连接AI核心概念,并深入探讨了AI在流体力学/气象预测和分子动力学/药物设计两大领域的革命性应用,最后分享了他因此创立气候科技公司 CuspAI 的初衷与实践。
本节重点
详细精要
自由能公式的普适性:能量(Energy)减去熵(Entropy)是物理学中统计力学的核心方程,同时也是机器学习中变分自由能(或称证据下界ELBO)的基础。这表明两个领域在最深层的数学结构上是一致的。演讲者正在撰写一本相关书籍,旨在帮助社区理解统计学与AI之间的这种深层联系。
能量与工业革命的类比:能量代表做功的能力,大约在1820年蒸汽机发明引发的工业革命中,人类开始用机器能量替代人的能量(或畜力)。这是将公式中的“能量项”进行了彻底的变革,极大地拓展了人类社会的生产力边界。
熵的深刻内涵与AI革命:
💬 精华片段(中文)
“能量是做功的能力...在工业革命中,能量项从人力能量转变为机器能量...而当前的AI革命,影响的是熵的部分,它在做的事是降低熵。” "The energy is our ability to do work... and in the industrial revolution we started to replace human labor with machine labor... the current AI revolution... affects the entropy part of the equation and it decreases the entropy."
本节重点
详细精要
传统科学R&D范式的痛点:旧有模式是科学家团队阅读论文、讨论,然后决定做一个实验,每个实验成本高达5万到10万美元。数据分析后,再开始下一轮思考和实验设计。这个循环耗时长、成本高、效率低。
范式转变:基于模拟的计算科学:
这种模拟能够为下一步真实的物理实验提供高价值的信息,从而精准地设计实验,减少实验次数,大幅削减实验间的等待时间。
范式飞跃:从模拟(Simulation)到仿真(Emulation):
💬 精华片段(中文)
“我们应该把第一次实验的数据存起来,训练一个神经网络来预测下一次实验的结果...这个过程叫仿真,一种用AI工具对模拟进行的模拟。我们在试图降低熵,从我们投入的功中学到尽可能多的东西。” "We should store the data from the first experiment in a database and train a neural network to predict the outcome of the next experiment... that process is emulation, the simulation of a simulation... we are trying to reduce entropy, to really learn as much as we can from the work we put in."
本节重点
详细精要
气象学家几十年如一日地收集数据,累积了PB级别的公开可用数据。在数据充足的地方,机器学习就有很大机会造成冲击。
方法论的完全转变:“忘掉物理学”:
这证明了,只要数据量足够大,使用何种具体的AI架构(Transformer、GNN等)在性能上差别不大,都是“巨型黑箱神经网络”。
从被质疑到被颠覆的行业心态:
转折点:仅仅两年后,AI模型的预测能力已不亚于甚至优于传统数值求解器,但其推理速度却是后者的10000倍。这一巨大的效率跃升彻底打开了气象学家们的眼界,他们不仅从怀疑转向接受,甚至开始主动发表论文证明AI模型的有效性。
前沿模型Aurora的创新:
💬 精华片段(中文)
“他们说,‘我们做这个都一百年了,你不可能用机器学习就改变我们的领域’...但仅仅两年后,这些模型不仅预测得更好,而且速度快了一万倍,这真正让他们开了眼界。” "They would say, 'We've been doing this for a hundred years, you're not gonna come in with a machine learning model and transform our field'... after two short years these models were better in predicting and 10,000 times faster, which really opened their eyes."
本节重点
详细精要
应用场景广泛:设计治疗未解疾病的药物、提高效率的光伏材料、减少摩擦(全球20%热量因摩擦损失)的润滑剂、在更低能量下驱动反应的催化剂、合成肥料时减少碳排放的固氮过程(当前哈勃法占全球碳排放5%),以及用于直接空气碳捕集的新材料。
分子模拟的物理复杂性:
尽管出现了如密度泛函理论(DFT) 等良好的近似方法(计算复杂度降至电子数的立方量级),并因此获得诺贝尔奖,但由于分子系统本质上是混沌且非线性的,长时间的动力学演化依然极其困难,这个过程复杂到需要用概率分布来描述初始条件。
关键AI技术一:等变性与图神经网络
系列工作:演讲者实验室的Taco Cohen、Maurice Weiler 等人在此领域做出了开创性贡献,Weiler 的博士论文是该领域的标志性著作,内容从入门到高阶,全面且开源。
机器学习力场(ML Force Fields)的地位:
💬 精华片段(中文)
“如果你不把对称性(例如旋转)构建到模型里,模型就不懂这一点,它会把每个朝向都当成一个全新的分子。这会非常、非常数据低效。” "If you don't build this symmetry into your models, your model will not understand it and it will treat every orientation as an entirely new molecule. It's very, very data inefficient."
本节重点
详细精要
从这个角度看,编码器端对应一个走向热力学平衡的过程,而学习逆转这个过程(解码)则相当于对系统做功以降低其熵,使其重新结构化。后来的研究将这一过程形式化为随机微分方程(SDE),大幅提高了采样效率,形成了如今强大的扩散模型。
从生成狗的图像到生成救命药物:
💬 精华片段(中文)
“与其生成雪地里的狗,我们能做些有用的事吗?事实证明,你也可以生成分子...你可以从噪声开始,加上你想要的属性,然后生成具有近似那些属性的分子。” "Instead of cute dogs in the snow, can we actually do something useful? It turns out you can also generate molecules... start from noise, possibly with properties you like, and then generate molecules that have approximately those properties."
本节重点
详细精要
负排放时代:从约2015年起的之后一个世纪里,人类必须开始从大气中大规模抽取CO2,速率将高达每年200亿吨,相当于每年移除一个日内瓦湖(Lake Geneva)大小体积的液态CO2,持续50到100年。而目前实现这一目标的技术不存在或成本极高。
直接空气碳捕集(DAC)的自由能分析:
而实际的工程效率必有损失,更现实的能耗可能占到全球总能耗的50%,这是一个数万亿美元的惊人成本。由于大气是 “公地悲剧” 的典型,缺乏让污染者付费的机制,因此解决问题的思路只有两条:要么由政府让排放更昂贵,要么由技术人员让碳移除成本更便宜。
CuspAI的解决方案与战略:
💬 精华片段(中文)
“这是一场公地悲剧。我们可以免费使用大气,免费污染它,没有人为此买单...我们能做的,要么是让排放更贵(政治家的事),要么是让移除二氧化碳更便宜(我们技术人员的事)。” "The atmosphere is a typical tragedy of the commons. We can all use it for free, we can pollute it for free, nobody pays the bill... One thing we can do is make emissions more expensive... or we can make the removal of carbon dioxide cheaper. And that's for us guys, the technicians."
本节重点
详细精要
问题一:关于AI发现分子的可复现性和全链路挑战(提问者:Chopan Taga)
问题二:关于稀疏或不完整数据下替代模型的有效性(提问者:Olui)
💬 精华片段(中文)
“你必须在你的平台中对所有这些下游环节进行建模...一旦你把这些都模型化了,你就可以在平台上为此进行优化。” "We model all of that also in our models... once you have modeled all these things you can then also optimize for them in your platform."
| 术语 | 解释 |
|---|---|
| 自由能(Free Energy) | 统计力学核心概念,公式为能量减去熵。在本语境中,它既是物理系统做功能力的度量,也是机器学习中ELBO目标的物理对应,完美连接了物理学和信息论。 |
| 熵(Entropy) | 代表系统无序程度或信息缺失的度量。在AI中,它代表模型对隐变量等未知因素的不确定性。AI革命的目标之一就是通过学习来降低它。 |
| 证据下界(ELBO) | 变分推断中的优化目标,全称为Evidence Lower Bound。它是变分自由能,在VAE等生成模型中用于最大化数据似然的下界。 |
| 仿真(Emulation) | 在科学计算中,指用训练好的AI模型去预测另一个复杂的物理模拟(如量子力学计算)的输出。它比原始模拟快几个数量级,是实现高通量筛选的基础。 |
| 等变性(Equivariance) | 神经网络的一种性质:当输入发生某种变换(如旋转)时,输出也会发生相同方式的变换。在分子建模中构建等变性,能让模型天然理解物理对称性,极大提高数据效率。 |
| 图神经网络(GNN) | 一种能处理图结构数据的神经网络。分子可以自然地表示为一个图(原子为节点,化学键为边),因此GNN是分子建模的核心工具。 |
| 密度泛函理论(DFT) | 一种求解多电子体系薛定谔方程的近似方法,是计算化学的主力工具,计算复杂度为电子数的立方,获得了1998年诺贝尔化学奖,但其成本仍限制了可用于模拟的体系大小和时间尺度。 |
| 扩散模型(Diffusion Models) | 一类受非平衡热力学启发的生成式模型。它通过前向过程向数据逐渐添加噪声,再学习一个逆向过程来从噪声中重建数据,在图像和分子生成等领域效果显著。 |
| 直接空气碳捕集(DAC) | Direct Air Capture,一种直接从环境空气中捕获二氧化碳的技术。本演讲指出,其核心挑战源于空气中CO2极低的浓度(0.04%),导致分离过程的熵变巨大,能耗和成本极高。 |
| 金属有机框架(MOF) | Metal-Organic Frameworks,一类由金属离子和有机配体构成的多孔晶体材料,具有超大比表面积和可调节的孔道结构,被认为是气体吸附和分离的理想候选材料。 |