▶ 原文链接
在 AI 时代重新构想科学发现
来源: YouTube | Max Welling | May 05, 2026
分类: 其他
原文发表: May 05, 2026
纪要生成: 2026-06-25
全集重点
- AI 革命的第三波浪潮:继工业革命和信息革命之后,由 物理 AI 和 新材料发现 驱动的新一轮创新将与前两波浪潮形成自我强化的良性循环。
- 计算范式的根本转变:从实验驱动到数据驱动,再到模拟驱动,化学与材料科学正经历一场根本性的方法论变革,计算的比重将远超实验。
- AI 加速器的核心逻辑:利用机器学习(尤其是神经网络)为传统物理、化学模拟方法构建模拟器(Emulators),可在保证精度的前提下将计算速度提升 3到4个数量级。
- 从辅助工具到设计引擎:生成式 AI(如扩散模型)与高通量评估的结合,使 AI 从分析工具转变为能够从头设计具有特定属性新材料的“材料引擎”。
- 欧洲的战略机遇:虽然在大语言模型竞赛中稍显落后,但欧洲在物理 AI、机器人、制造业和材料科学的深厚底蕴使其有机会在新的“主权堆栈”竞争中占据领先地位。
嘉宾/话题简介
Max Welling 是欧洲最受尊敬的 AI 科学家之一,同时担任 阿姆斯特丹大学 教授和 Cos AI 联合创始人兼首席技术官。Cos AI 致力于将机器学习应用于材料发现中最棘手的问题,其工作处于严谨科学与现实世界影响力的交叉点。本集演讲中,Max Welling 深入探讨了 AI 将如何重新构想科学发现,特别是材料设计领域的范式转移,并展示了 Cos AI 构建的从生成、评估到实验反馈的端到端材料设计平台。
分节详述
00:00 AI 驱动的材料革命:三波浪潮的良性循环
本节重点
- 当前正处于用 AI 增强人类智能的第二次技术革命。
- 第三次革命将是物理 AI 和材料发现的革新。
- 这三波浪潮——工业革命、信息/AI 革命、材料/物理 AI 革命——将相互促进,形成加速循环。
详细精要
💬 精华片段(中文)
"这些革命实际上会相互促进。工业革命引发了人工智能革命。而人工智能革命将推动物理人工智能和新材料的设计。然后,新材料又将为人工智能革命再次提供动力……这将是一个不断加速的良性循环。"
"So, these revolutions will actually feed off of each other. So, the Industrial Revolution resulted in the AI Revolution. The AI Revolution will power physical AI and the design of new materials. And then from there, new materials will power the AI Revolution again... So, this will be a virtual cycle that will accelerate."
05:50 范式的转变:从实验驱动到模拟驱动
本节重点
- 材料科学的创新方式经历了从纯实验到数据分析,再到快速发展的计算机模拟三个阶段。
- 计算的普及使“在计算机里做实验”(in silico)成为可能,旨在减少昂贵且耗时的物理实验。
- 新的范式不仅依赖 GPU,也需要 CPU 和 ASIC 等多样化的计算资源。
详细精要
06:50 数据和 AI 的闭环:从单次计算到持续学习
本节重点
- 传统的模拟模式是“一次性”的,每次对新候选材料的评估都需从头开始计算,耗费巨大能量和信息。
- 新范式主张将所有模拟和实验结果存入大型数据库,并用这些数据训练神经网络。
- 训练好的神经网络可作为加速器,通过机器学习力场或直接属性预测器来快速评估新候选者,从而解锁大规模搜索。
详细精要
08:23 挑战的根源:从牛顿到薛定谔和混沌
本节重点
- 分子模拟的核心挑战在于,虽然使用简单的牛顿方程来更新分子运动,但计算原子的受力却极度困难。
- 计算这种力需要解决薛定谔方程,这对于超过 10 个电子 的系统几乎是不可完成的。
- 分子模拟还面临着时间尺度限制(纳秒级 vs. 所需的微秒或更长)、混沌效应和近乎无限大的化学搜索空间等多重挑战。
详细精要
10:58 AI 模拟器:为传统方法提供纳秒到微秒的加速
本节重点
- 在物理学界已有一套从量子力学到连续介质的多尺度模拟工具链。
- AI 的角色是为这个链条上的每一环都构建一个对应的机器学习模拟器,可将计算速度提高 3到4个数量级。
- 这覆盖了从量子蒙地卡罗、DFT、分子动力学、粗粒化模拟一直到偏微分方程求解的完整级别。
详细精要
💬 精华片段(中文)
"对于每一种(模拟方法),都有一个 AI 或机器学习等价物……有时会快三到四个数量级。我们称这些为‘模拟器’。这些模拟器是使用在大量数据上训练的神经网络来解决相同方程,以加速此过程的方法。"
"For each one of them there is a AI or machine learning equivalent that... will accelerate this sort of sister methods by many orders of magnitudes. Sometimes three to four orders of magnitudes faster. And that's what we call emulators."
12:00 颠覆性案例:从量子计算到蛋白质折叠和天气预报
本节重点
- DeepMind 的 FermiNet 模型通过预测波函数加速了量子蒙地卡罗计算。
- 微软 训练了一个 ML 泛函,能以 DFT 精度但用近似经典力场的速度进行模拟,这可能是一项有潜力获得诺贝尔奖的成果。
- Meta 的 UMA 和 剑桥的 MACE 等 ML 力场模型,能够以 DFT 精度 模拟大型分子,正在彻底革新计算化学领域。
- 蛋白质折叠(AlphaFold) 和天气预报(微软 Aurora) 是 AI 颠覆传统科学的标志性案例,后者不仅在速度上实现了 10,000 倍 的提升,精度也超越了基于物理方程的数值求解器。
详细精要
- 量子力学层面的颠覆(DeepMind FermiNet):
- FermiNet 将分子的配置输入一个遵守量子力学原理(如泡利不相容原理)的神经网络,预测出一个波函数,然后从中计算能量并求取基态。
-
这项工作极大地加速了量子蒙地卡罗(Quantum Monte Carlo) 方法的求解,速度提升了许多数量级。
-
DFT 层面的革新(微软):
- 微软团队使用海量数据训练了一个 ML 泛函,使得计算可以在接近经典力场的速度下达到 DFT 级别的精度。
-
Max Welling 预测,这项工作有朝一日可能获得诺贝尔奖。因为传统 DFT 方法本身就是诺贝尔奖级别的技术,而 ML 力场化大大扩展了其应用边界。
-
ML 力场模型(UMA, MACE):
- 这些模型先用 DFT 计算生成关于分子力的海量数据,然后训练一个神经网络直接预测这些力。
- 这使得可以在 DFT 精度下模拟通常只有经典力场才能达到的大分子体系。
-
Max Welling 认为这正在彻底革新(revolutionizing)整个计算化学领域。
-
生命科学与地球科学的标杆(AlphaFold & Aurora):
- AlphaFold:使用机器学习方法,基于大量数据训练,预测蛋白质的三维结构,解决了重大化学问题,并获得了 2024 年诺贝尔奖。
- 微软 Aurora 天气预报模型:
- 使用 35 个 A100 GPU 训练了 3 个月,数据来自气象学家数十年来保存的数 PB 的公开大气状态数据。
- 替代了求解纳维-斯托克斯方程(Navier-Stokes equations) 等 PDEs 的传统数值求解器。
- 预测速度提升了 10,000 倍。
- 更惊人的是,因为是在真实数据上训练,它的预测比物理模型更准确。这最初遭到了资深气象学家的强烈怀疑,但现在已被主流气象软件接纳和整合。
16:11 生成式 AI 设计新材料:随机热力学的魔法
本节重点
- 生成视频和图片的扩散模型技术,同样可以用来生成具有特定属性的分子,例如新电池材料或药物。
- 扩散模型的运作机制与非平衡态随机热力学深度绑定,其核心是在正向扩散中“破坏”结构(熵增),在反向生成中学习并施加“力”来逆转时间(熵减)。
- Cos AI 已将此技术用于生成金属有机框架(MOFs),这类材料可用于碳捕获和水净化,并曾获 2024 年诺贝尔化学奖。
详细精要
24:03 Cos AI 的材料设计引擎:从提示词到合成配方
本节重点
- Cos AI 的使命是构建连接数字设计和物理实验的平台,以解决半导体、能源转型等源于材料的挑战。
- 公司成立于 2024 年,已融资 2.2 亿美元,团队约 50 人,总部位于剑桥,背后有强大的领导团队和顾问委员会。
- 其“材料引擎”的运作流程是:用户用自然语言输入需求 → 搜索代理规划路径 → 从数据库或生成模型中创建候选材料 → 经过多级筛选漏斗 → 进行物理实验 → 反馈数据至数据库。
详细精要
- Cos AI 公司概况与愿景:
- 成立时间:2024 年。
- 融资规模:至今已筹资 2.2 亿美元。
- 团队规模:约 50 人。
- 全球布局:总部在英国剑桥,并在阿姆斯特丹、伦敦、柏林、新加坡、东京和旧金山设有团队。
-
核心使命:构建一个数字平台以设计新材料,并将其与高通量物理实验连接,获得反馈闭环。Max Welling 认为人类未来的挑战(如半导体、能源转型)都植根于材料问题。
-
关键团队与顾问:
- CTO:Max Welling 本人。CEO:Chet Atwood。
- Aaron:新近加入的材料科学领域的知名科学家。
- Alessandro de Maria:首席架构师兼 MLOps 负责人(可能是与 Nabis 等技术合作方对接的关键人物)。
-
强大的顾问委员会:包括 ASML 前 CTO 兼总裁 Martin van den Brink、BP 前 CEO Lord Brown、AI 先驱 Geoffrey Hinton 和 Yann LeCun、以及管理 Materials Project 的 Kristin Persson 等。
-
Cos AI 平台“材料引擎”的工作流程:
- 输入:用户以自然语言(像“Vibe coding”一样)提出需求,明确想要的属性。
- 代理规划:一个搜索代理接收查询,制定优化的编排计划,决定使用哪些工具、按什么顺序来寻找好材料。
- 第一步:检索。代理首先会查询数据库,寻找已有的、可能满足要求的材料。Cos AI 已从大型出版社购买了数据许可。
- 第二步:生成。如果数据库中没有,就转向生成模型,生成数千甚至数十万(上次活动达到了 50 万个)个候选者。
- 第三步:筛选漏斗。候选人进入一个层层筛选的漏斗:
- 快速属性预测器:筛选掉物理上不可能的、不稳定的、带电荷的候选者。
- 更昂贵的模拟:随着模拟工具变得昂贵,剩余的候选者越来越少。
- 第四步:实验验证。候选者最终进入物理实验室。策略取决于实验速度,高通量/自驱动实验室可以做大量实验,则数字筛选步骤可减少;若实验昂贵,则尽可能多地进行计算。Max Welling 将物理实验视为另一种形式的计算——“自然的计算”。
- 反馈循环:代理检查结果,如果不满意,会重新生成。最关键的是,每个阶段产生的数据和洞见都会返回数据库,以便下次迭代时更快更准。
💬 精华片段(中文)
"我把实验室或多或少地看作另一种计算的方式。它不是数字计算,而是自然的计算。它有点困难和笨拙……但归根结底,你是在做一项由自然完成的计算。"
"I think of a lab more or less as another way to compute. It's not a digital compute but it's natural compute. It's a bit hard and clumsy to you know to program... but in the end you're doing a computation done by nature."
28:40 平台演示:为半导体设计低介电常数 MOF
本节重点
- 演示了一个完整的材料设计案例:为半导体互连层寻找一种特定属性的 MOF 材料。
- 平台自动化执行了生成、验证、属性计算、报告撰写和合成路线建议的全流程。
- Cos AI 团队已经跑通了从计算机设计到实验室合成、再到实际测试的整个流程。
详细精要
- 用户输入的查询:
-
需求:“生成高孔隙率、带有电惰性金属节点的 MOFs,适用于半导体互连层中的低介电常数电介质。弛豫这些结构,使用 MOF 检查器验证其有效性,并计算空隙率。”
-
平台的自动执行过程:
- 规划:AI 代理理解查询后,将任务分解为生成 MOFs、弛豫结构、验证、计算空隙率等步骤。
- 生成:调用生成模型(在实际产品中可实时生成,演示中加速显示),生成了大约 17 个 结构。
- 评估:立即调用专门为 MOFs 设计的工具 Zeo++,实时检查这些生成的候选者是否具有所需属性。这些属性预测器超级快。
- 报告:收集结果,撰写一份总结报告。报告会指出哪些候选者无效,哪些有效,并按前景进行排名。
- 可视化:用户可以点击查看任何一个排序靠前的候选材料的3D结构,包括其金属节点和连接体。
-
合成路线建议:生成出候选材料只是第一步,更重要的是要知道如何制造它。平台会去文献中搜索与生成结构非常相似的 MOFs,查找它们的合成配方,然后提出合成该新 MOF 的可能路径。Max Welling 提到,化学家认为这些建议是“并非不合理的”。
-
从虚拟到现实的闭环验证:
- 为了验证整个流程,Cos AI 团队实际在实验室中合成了生成的 MOF。
- Max Welling 展示了该材料的照片,强调其因金属不同而呈现出的多彩颜色。
- 他们将其送至美国进行台架测试,以验证其性能。
- 虽然第一批产品有效,但并未超越现有技术,这只是一个打通并测试整个流程的里程碑。
31:45 结论与展望:物理 AI 是未来,材料是基石
本节重点
- 我们正处于从数字 AI(聊天机器人) 向 物理 AI 过渡的浪潮起点。
- 物理 AI 将数字大脑与充满摩擦的物理世界相连接,这是一项巨大的挑战,但也充满希望。
- 物理 AI 将催生对不同类型计算的需求,不仅仅是 GPU 和 Transformer 架构。
- 材料是这些问题的根源,对于欧洲实现技术主权至关重要。
详细精要
34:55 问答环节:数据、验证与物理规律的权衡
本节重点
- “苦涩的教训” 的适用性取决于数据量:在海量数据下,大模型胜出;在小数据下,物理先验至关重要。
- 验证方式多样,从传统的分布外测试到用 AI 评测 AI,再到面向化学家用户的 A/B 测试。
- 面对罕见但极高价值的事件(“黑天鹅”),不确定性预测 是关键解决方案。
详细精要
- 关于“苦涩的教训”与领域知识(回答第一个问题):
- “苦涩的教训”和大力出奇迹(Scaling Laws)的策略在拥有海量数据时非常有效。
- 但在 Cos AI 所在的化学领域,数据远非海量。例如,材料科学领域因为数据量大,黑盒大模型表现很好。但在许多化学问题上,计算一个 DFT 数据点都非常昂贵,因此必须采用不同策略。
- Cos AI 的方法是与 Meta 等合作,先在大规模数据上训练出“过得去”的化学基础模型(Machine Learning Force Fields),这类似于通用大模型。
- 但在针对特定材料进行实际模拟时,会对其进行微调,使其在特定问题上更小、更快。
-
在这种小数据微调场景下,物理先验(如等变性、对称性)帮助巨大。即使是大模型 MACE 和 UMA,其核心差异也在于它们内置了这些物理对称性。
-
关于模型和结果的基准测试(回答 Olga 的问题):
- 属性预测器:因有带标签的数据集,可进行标准的分布外验证和测试。
- 搜索/优化(如贝叶斯优化):验证难度更大。
-
对话式 AI 智能体:验证最为困难。Cos AI 采用用大模型评测大模型的典型范式,并且最终目标是让化学家进行A/B 测试。
-
关于罕见但重要事件的建模(回答 Vlad 的问题):
- Max Welling 认为这是一个很好的问题,并且他一直在思考。
- 他和他的学生 Dario Cortese 的方法不是仅仅预测一个答案,而是同时预测答案的不确定性。
- 当模型被应用到未见过数据的领域外时,其预测的答案区间(不确定性窗口)会扩大。
- 如果这个不确定性窗口太大,系统就应停止,或主动采集更多数据。因此,不确定性预测是处理这类问题的关键。
38:23 问答环节:技术栈、生态与影响
本节重点
- Cos AI 采用混合模型策略,同时使用闭源大模型(如 Anthropic Claude)和自己训练的开源权重模型。
- Cos AI 正建立一个生态系统,将计算提供商、各类实验室连接至其平台,以跑通从预测到实验反馈的整个商业模型。
- 所有机器学习模型都面临训练-测试数据漂移问题,解决方案是基于不确定性的主动学习循环。
- 对于稀土问题,平台可用于寻找更廉价的提取方法,如从海水中提取锂。
- 随机热力学和扩散模型在数学上有着深刻的统一性,可用于解决像计算药物与蛋白质结合自由能差这样的实际问题。
- 对未来机会的建议:放弃 LLM 的存量竞争,投身于物理 AI 和机器人结合的下一个大市场。
详细精要
- 关于内部使用的 LLM 模型(回答 Daniel 的问题):
- Cos AI 同时使用闭源模型(如演示中使用的 Anthropic 的 Claude,并为其提供了大量数据和工具)和自己微调或训练的开源权重模型。
-
他们正在将这两种方案进行对比,研究各自的优缺点。
-
关于实验室工作的具体连接(回答 Behrang 的问题):
- Cos AI 正在打造一个称之为 “Foundries” 的生态系统。
- 计算侧:与计算提供商(如 Nebius 等)合作,通过提供免费或低成本的云计算资源,来催化传统化学公司将计算负载迁移到云端。
- 实验侧:与全球各地的实验室签订合约,如新加坡的 A* Labs、丹麦技术大学(DTU)、剑桥大学和荷兰的多个实验室。Cos AI 正在努力标准化其平台与不同实验设备的连接。
-
商业模式:客户提出材料需求,Cos AI 利用 AI 和合适的 CRO (合同研究组织)/实验室网络开展设计活动,实验室合成并测试,反馈给 AI,最终设计出目标材料再“卖回”给客户。
-
关于数据漂移问题(回答 Vladislav 的问题):
- 这是所有机器学习面临的普遍问题。如天气预报模型在特定大气条件下训练得很好,但气候科学家会质疑其在二氧化碳浓度变化后的可靠性。
-
解决方案是建立一个基于不确定性的主动学习循环:当模型预测的不确定性升高时,就意识到模型在这个数据空间表现不佳,并开始在此空间采集新数据来微调模型。这是一个持续的过程。
-
关于稀土和材料生产(回答 Tommy 的问题):
- Cos AI 目前并未直接从事替代稀土的研究,但这在他们的关注列表上。
-
一个有前景的方向是采矿业,例如,如何从矿物浓度极低的海水中,以比挖掘开采更便宜的方式,低成本地提取锂等关键元素。这类从低浓度中选择性捕获特定分子的难题,非常适合利用 Cos AI 的平台来解决。
-
关于随机热力学与生成式 AI(回答关于其书籍的问题):
- 令人惊讶的是,随机热力学(也称非平衡态热力学)的数学,与机器学习中许多方法(扩散模型、变分推断)极其相似。
- 两边都可以写出一个自由能(能量减去温度乘以熵)的方程。在物理学中对应的是弛豫过程,在ML中对应的是变分推断。
- 还有许多具体的联系,如 Radford Neal 发展的 Annealed Importance Sampling 等同于非平衡态物理中的 Jarzynski 等式。
-
最新应用:利用这些思想来训练一个扩散模型,将一个小分子“移动”并“对接”到一个蛋白质上,以计算该过程的自由能差,这对于评估药物与蛋白质的结合强弱至关重要。
-
对未来方向的建议(回答最后一个问题):
- 大语言模型(LLMs)和聊天机器人的竞赛已经基本尘埃落定,不建议再介入。
- 量子计算还太遥远。
- 明确建议:下一个风口是机器人学和物理 AI。将 AI 嵌入到每一个物理设备中,包括汽车、人形机器人、实验设施等。
- 核心在于将物理与 AI 结合,并打磨好数字与物理世界的交互界面。Max Welling 认为这是他的努力方向,也推荐在场观众在这上面投入精力。
专业术语注释
| 术语 |
解释 |
| Physical AI |
物理 AI,指嵌入到物理世界和物理设备(如机器人、汽车)中,与物理环境进行交互的 AI。与仅处理信息的数字 AI(聊天机器人)相对。 |
| In Silico |
拉丁语,意为“在硅中”,指通过计算机模拟来进行的(实验),与在生物体内(in vivo)或在试管中(in vitro)相对。 |
| Schrödinger equation |
薛定谔方程,量子力学中描述微观粒子(如电子)状态随时间变化的波动方程。对复杂分子进行精确求解计算量极大。 |
| DFT (Density Functional Theory) |
密度泛函理论,一种通过电子密度代替波函数来研究多电子体系电子结构的量子力学近似方法,计算成本远低于直接求解薛定谔方程,但精度仍有浮动。 |
| Force Fields |
力场,一套用于计算分子体系中原子受力的函数和参数。经典力场计算快但精度低,机器学习力场旨在以DFT精度但等同于经典力场的速度计算。 |
| Emulators |
模拟器。在本文中指通过机器学习(主要是神经网络)训练出来的、用以替代传统物理/化学模拟方法的模型,旨在将计算速度提升数个数量级。 |
| SDE (Stochastic Differential Equation) |
随机微分方程,用于模拟包含随机性过程的微分方程。在扩散模型中,用于描述数据逐渐被噪声破坏的过程。 |
| Diffusion Models |
扩散模型,一类生成式模型,通过学习逆转一个逐渐向数据中添加噪声的过程来生成新数据(如图片、分子)。 |
| MOFs (Metal-Organic Frameworks) |
金属有机框架,一类由金属离子/团簇与有机配体连接形成的多孔晶体材料,因其超高的比表面积,在气体吸附、分离、催化等领域前景广阔。 |
| GCMC (Grand Canonical Monte Carlo) |
巨正则系综蒙特卡洛模拟,一种用于模拟在恒定化学势、体积和温度下,流体分子在多孔材料中吸附行为的统计力学方法。 |
| Bitter Lesson |
“苦涩的教训”,由 Richard Sutton 提出的观点,认为 AI 研究的历史表明,利用海量计算的长处、通用方法最终总是优于基于特定领域人类知识的精巧方法。 |
| Uncertainty Prediction / Quantification |
不确定性预测/量化,使机器学习模型不仅能给出预测结果,还能给出该结果的置信度或误差范围,对于识别模型是否在其训练数据覆盖域内运行至关重要。 |
| Active Learning Loop |
主动学习循环,一种迭代训练策略,模型主动识别出自己预测不确定性高的数据点,并由专家(人或实验)进行标注或产生新数据,然后使用新数据重新训练模型。 |
| Sovereign Stack |
主权堆栈,指一个国家或地区在关键技术上拥有独立自主、不受制于他人的完整技术体系,如独立的芯片设计制造、基础大模型、核心软件等。 |
延伸思考
- 计算服务商的战略转型:Max Welling 明确指出物理 AI 负载(如 DFT 计算)与当前主流的 LLM 训练/推理负载完全不同,可能需要 CPU、ASIC 等异构计算资源。这对 Nebius 等云计算公司的数据中心硬件采购和产品设计提出了挑战:是坚守 GPU,还是提前布局为一站式“科学计算平台”提供异构算力?
- “硅基科学家”的崛起:Cos AI 平台展示的工作流本质上是提炼和自动化了顶尖化学家的思维模式(查询数据库、生成候选、设计实验、反馈迭代)。这种“AI 科学家”的泛化能力边界在哪里?它会在多久后从辅助工具发展为能做出颠覆性科学假设和发现的“第一作者”?这将对科研伦理和科学共同体组织形态产生何种冲击?
- 数据飞轮的壁垒:Max Welling 强调所有数据最终都会回流到 Cos AI 的数据库中,这意味着平台用得越多,其模拟器和预测器就越强、越快。这种“数据-模型”飞轮是否会让先发者形成赢家通吃的垄断地位?这与科学界倡导的开放科学、数据共享原则应如何平衡?
- 物理先验的回归:虽然“苦涩的教训”强调大数据和大算力,但 Max Welling 也指出在数据稀缺的具体科学问题上,物理先验(等变性、对称性等)仍然是决定模型效率的关键。这是否意味着下一代 AI 架构(尤其在科学领域)将是 Transformer 等通用架构与强物理约束的深度融合,而非纯粹的“大力出奇迹”?
- 从“挖矿”到“炼矿”:演讲中提到了从海水中低成本提取锂的设想。这代表了材料科学的一个高阶范式转移:从被动地寻找天然存在的新材料,过渡到主动设计从稀薄资源中高效获取目标物质的过程。如果此类技术成熟,将可能彻底颠覆全球资源分布、地缘政治和供应链格局。
原文发表:May 05, 2026 · 纪要生成:2026-06-25