▶ 原文链接

材料搜索:生成、仿真、模拟

来源: YouTube | Max Welling | May 06, 2025 分类: 其他 原文发表: May 06, 2025 纪要生成: 2026-06-25


全集重点


嘉宾/话题简介

Max Welling教授是阿姆斯特丹大学机器学习领域的教授和研究主席,同时也是材料设计初创公司Cusp AI(原名Carbon AI)的联合创始人兼首席技术官。他拥有理论高能物理学博士学位,之后转向机器学习领域。Welling教授是机器学习领域的先驱,共同发明了变分自编码器(VAE),并担任过NeurIPS的程序主席和大会主席,也是ELLIS的创始成员。本次演讲主要阐述了他将非平衡热力学与生成式AI联系起来的深刻见解,并展示了如何利用这一框架以及多保真度仿真技术来加速新型吸附材料的发现,以应对气候变化中直接空气碳捕集的巨大挑战。


分节详述

[00:00] 开场介绍与两个核心动机

本节重点

详细精要

💬 精华片段(中文)

“如果你是一种外星物种,能够追踪世界上每个分子的每一个细节,你就不会体验到或定义任何熵。在微观层面,熵并不真正存在。它只存在于我们的宏观层面。” "If you would be an alien species and you would be able to track every detail about every molecule in the world, you would not experience or define any entropy. There would not be any entropy. So, at the microscopic level, entropy really doesn't exist. It's only at our macroscopic level that entropy exists."


[05:12] 碳捕集的挑战:用热力学算一笔账

本节重点

详细精要

💬 精华片段(中文)

“所以我们就处于这个绝妙的、有趣的境地:为了计算实现分离所需的能量,我们可以进行一个组合论证。我们只需要看信息。我们可以数数。” "And so, we're now at this fantastic interesting situation that in order to compute the amount of energy that we need to do in order to achieve the separation, we can do a combinatorial argument. We can just look at information. We can count things."


[12:29] 生成式AI与热力学的联系:从VAE到扩散模型

本节重点

详细精要

💬 精华片段(中文)

“我的观点是,描述热力学系统或非平衡热力学系统的数学,与描述机器学习系统的数学是完全相同的。” "So, my point is that the mathematics that describes thermodynamic systems or non-equilibrium thermodynamic system is exactly the same mathematics as describes machine learning systems."


[26:58] 统一框架:从扩散模型到薛定谔桥

本节重点

详细精要

💬 精华片段(中文)

“但要做一些真正有用的事,你实际上也可以生成分子,对吗?去解决一个真实的问题,比如疾病或开发药物。” "But to do something truly useful, you can actually also generate molecules, right? And solve maybe a real problem like you know, a disease."


[30:33] 从模拟到仿真:多保真度加速

本节重点

详细精要

💬 精华片段(中文)

“我们想用一种仿真来替代执行如量子化学模拟这样的昂贵仿真。那么,什么是仿真?……我们想要做的是,在某种意义上,回收我们以前模拟所使用的能量。” "We want to change that to emulations. Okay, so what is an emulation? ... So how do we do that? ... what we want is to recycle the energy in some sense that we used for this simulation."


[37:50] 极致加速:构建可学习的经典密度泛函理论

本节重点

详细精要

💬 精华片段(中文)

“这个故事的妙处在于,我们仅仅使用了势为零的体相数据。……我们做两次自动微分——顺便说一句,对一些物理学家来说,这曾是一个巨大的惊喜——你居然可以做到这一点。” "And the the beauty of this method was is we can always we just we only use bulk which is the potential zero... We do two times auto differentiation which by the way was a big surprise to some physicists that you can do this."


[45:37] 可信的筛选:贝叶斯不确定性量化

本节重点

详细精要

💬 精华片段(中文)

“我们在做廉价快速计算并丢弃东西时,你想知道你99%确定那确实是个好决定。所以你想知道,做出那个决定的置信度是多少。” "If you have this multi-fidelity stack and you're throwing away things when you're doing cheap fast calculations, you want to know that you're 99% certain that that was actually a good decision. And so, you want to know what is the your confidence in making that decision."


[51:21] 总结与问答环节

本节重点

详细精要

💬 精华片段(中文)

“我认为我们有一项非常重要的共同任务,那就是解决社会在医疗健康和气候方面的一些最大问题。不幸的是,如今我们不能指望我们的政客,所以我们得自己动手。” "And I think we have a very important task together to solve some of society's biggest problems in both healthcare and climate. And unfortunately these days we cannot count on our politicians. So we have to do it ourselves."


专业术语注释

术语 解释
自由能 在热力学和统计力学中,指系统在等温等容或等温等压过程中能对外做的最大有用功。在本集中,它是连接物理熵、能量和机器学习(ELBO)的核心概念。
非平衡热力学 研究不处于热力学平衡态的系统的热力学分支。本集将其用于理解和统一扩散模型、VAE等生成式AI模型的工作机制。
在热力学中代表系统的无序性或我们对其微观状态的信息缺失。在机器学习中,它衡量概率分布的不确定性。本集多次强调熵是信息论的直接体现。
变分自编码器(VAE) 一种由Max Welling等人在2013年提出的生成式模型,由一个编码器(将数据压缩到潜在空间)和一个解码器(从潜在空间重建数据)组成。
扩散模型 一种生成式模型,通过逐步向数据添加噪声(前向过程)直至变成纯噪声,然后学习一个反向去噪过程来生成新数据。
直接空气捕获(DAC) 一种从大气中直接捕获并分离二氧化碳的技术,区别于从烟囱等点源捕获。
金属有机框架(MOFs) 一类由金属离子或簇与有机配体桥接形成的具有周期性网络结构的多孔晶体材料,具有极高的比表面积,非常适合气体吸附和分离。
吸附剂 在本集中指能够从气体或液体混合物中吸附特定分子(如CO₂)的固体材料,MOFs是其一种。
密度泛函理论(DFT) 一种研究多电子体系电子结构的量子力学计算方法,是材料科学和量子化学中最广泛应用的计算方法之一,计算成本较高。
等温线 在恒定温度下,吸附剂对某种气体的吸附量随气体压力变化的曲线。是评估吸附材料性能的关键数据。
巨正则蒙特卡洛模拟 一种模拟系统与外界可交换粒子和能量以达到平衡状态的统计力学方法,常用于模拟吸附过程,计算量大。
仿真 在本集中指代用机器学习模型替代或加速传统物理模拟过程的新范式。
证据下界(ELBO) 在变分推断中,是模型对数似然的变分下界。它可以被解读为负的自由能,是本集统一物理学和机器学习的数学支点。
评分函数 在扩散模型中,指对数概率密度关于数据的梯度,它指示了如何修改当前数据点以使其概率更高,是训练扩散模型的关键。
经典密度泛函理论(cDFT) 一种用粒子密度场而非单个粒子坐标来描述流体平衡态热力学性质的理论框架,通过最小化巨势自由能泛函来求解。
薛定谔桥 一个在给定初始和终止概率分布的条件下,寻找最有可能的随机演化路径的问题,在物理学、控制论和机器学习中都有应用。
变分推断 一种近似复杂概率分布的机器学习方法,通过优化一个更简单的分布(变分分布)来逼近目标后验分布。
EM算法(期望最大化算法) 一种用于在含有隐变量的概率模型中寻找参数最大似然估计的迭代方法。本集将其与热力学的松弛(E步)和做功(M步)类比。
SMILES 全称"简化分子线性输入规范",是一种用ASCII字符串明确描述分子结构的规范。机器学习和生成模型常用它来生成和表示分子。
Fokker-Planck方程 描述在微小的随机涨落下,粒子速度或位置的概率密度函数随时间演化的偏微分方程,用于模拟动力学过程。
BARN 演讲团队开发的一种贝叶斯自回归神经网络,能够为序列模型(如PDE求解器、SMILES生成器)提供良好校准的不确定性估计。
径向分布函数 描述粒子密度围绕一个参考粒子如何变化的函数,是表征流体结构的关键物理量。
自洽场迭代 一种用于求解多体问题(如DFT)的数值方法,通过反复迭代直到输入和输出场达到一致(自洽)为止。

延伸思考

  1. “仿真”范式的潜力与局限:该讲座展示了用ML替代物理模拟的巨大加速潜力。然而,对于超出训练分布之外的“外插”问题,这些“仿真器”的泛化能力如何保证?BARN这样的贝叶斯方法能否给出可靠的外插不确定性警告?
  2. 物理归纳偏置的未来:关于等变性与数据增强的讨论,其本质是“结构先验”与“从大规模数据中学习”之争的一个缩影。在数据量持续爆炸的未来,精确物理模型的地位是会被彻底取代,还是会作为一种极端有效的先验知识,在关键领域(如安全攸关的应用)始终占据一席之地?
  3. 计算范式变迁的能耗悖论:讲座一方面指出碳捕集需要巨大能量,另一方面又提出用AI加速实现它。建设并运行支撑这些AI模型(尤其是训练)的数据中心本身也需要巨大的能源。我们是否有一个全局优化模型,能计算出为解决某个问题(如气候)而投入的计算本身所造成的环境成本与最终收益的盈亏平衡点?
  4. 材料发现的“最后一公里”问题:AI可以快速生成和筛选成千上万的候选材料,但化学合成和工艺放大是高度劳动密集且失败率极高的步骤。“天穹计划”是在极速推进这个过程。未来,AI驱动的自动化实验室(机器人化学家)是否是将此流程闭环、真正实现在数周内完成“设计-制造-测试”循环的必然选择?

原文发表:May 06, 2025  ·  纪要生成:2026-06-25