▶ 原文链接

在 AI 时代重新构想科学发现

来源: YouTube | Max Welling | May 05, 2026 分类: 其他 原文发表: May 05, 2026 纪要生成: 2026-06-25


全集重点


嘉宾/话题简介

Max Welling 是欧洲最受尊敬的 AI 科学家之一,同时担任 阿姆斯特丹大学 教授和 Cos AI 联合创始人兼首席技术官。Cos AI 致力于将机器学习应用于材料发现中最棘手的问题,其工作处于严谨科学与现实世界影响力的交叉点。本集演讲中,Max Welling 深入探讨了 AI 将如何重新构想科学发现,特别是材料设计领域的范式转移,并展示了 Cos AI 构建的从生成、评估到实验反馈的端到端材料设计平台。


分节详述

00:00 AI 驱动的材料革命:三波浪潮的良性循环

本节重点

详细精要

💬 精华片段(中文)

"这些革命实际上会相互促进。工业革命引发了人工智能革命。而人工智能革命将推动物理人工智能和新材料的设计。然后,新材料又将为人工智能革命再次提供动力……这将是一个不断加速的良性循环。" "So, these revolutions will actually feed off of each other. So, the Industrial Revolution resulted in the AI Revolution. The AI Revolution will power physical AI and the design of new materials. And then from there, new materials will power the AI Revolution again... So, this will be a virtual cycle that will accelerate."


05:50 范式的转变:从实验驱动到模拟驱动

本节重点

详细精要


06:50 数据和 AI 的闭环:从单次计算到持续学习

本节重点

详细精要


08:23 挑战的根源:从牛顿到薛定谔和混沌

本节重点

详细精要


10:58 AI 模拟器:为传统方法提供纳秒到微秒的加速

本节重点

详细精要

💬 精华片段(中文)

"对于每一种(模拟方法),都有一个 AI 或机器学习等价物……有时会快三到四个数量级。我们称这些为‘模拟器’。这些模拟器是使用在大量数据上训练的神经网络来解决相同方程,以加速此过程的方法。" "For each one of them there is a AI or machine learning equivalent that... will accelerate this sort of sister methods by many orders of magnitudes. Sometimes three to four orders of magnitudes faster. And that's what we call emulators."


12:00 颠覆性案例:从量子计算到蛋白质折叠和天气预报

本节重点

详细精要


16:11 生成式 AI 设计新材料:随机热力学的魔法

本节重点

详细精要


24:03 Cos AI 的材料设计引擎:从提示词到合成配方

本节重点

详细精要

💬 精华片段(中文)

"我把实验室或多或少地看作另一种计算的方式。它不是数字计算,而是自然的计算。它有点困难和笨拙……但归根结底,你是在做一项由自然完成的计算。" "I think of a lab more or less as another way to compute. It's not a digital compute but it's natural compute. It's a bit hard and clumsy to you know to program... but in the end you're doing a computation done by nature."


28:40 平台演示:为半导体设计低介电常数 MOF

本节重点

详细精要


31:45 结论与展望:物理 AI 是未来,材料是基石

本节重点

详细精要


34:55 问答环节:数据、验证与物理规律的权衡

本节重点

详细精要


38:23 问答环节:技术栈、生态与影响

本节重点

详细精要


专业术语注释

术语 解释
Physical AI 物理 AI,指嵌入到物理世界和物理设备(如机器人、汽车)中,与物理环境进行交互的 AI。与仅处理信息的数字 AI(聊天机器人)相对。
In Silico 拉丁语,意为“在硅中”,指通过计算机模拟来进行的(实验),与在生物体内(in vivo)或在试管中(in vitro)相对。
Schrödinger equation 薛定谔方程,量子力学中描述微观粒子(如电子)状态随时间变化的波动方程。对复杂分子进行精确求解计算量极大。
DFT (Density Functional Theory) 密度泛函理论,一种通过电子密度代替波函数来研究多电子体系电子结构的量子力学近似方法,计算成本远低于直接求解薛定谔方程,但精度仍有浮动。
Force Fields 力场,一套用于计算分子体系中原子受力的函数和参数。经典力场计算快但精度低,机器学习力场旨在以DFT精度但等同于经典力场的速度计算。
Emulators 模拟器。在本文中指通过机器学习(主要是神经网络)训练出来的、用以替代传统物理/化学模拟方法的模型,旨在将计算速度提升数个数量级。
SDE (Stochastic Differential Equation) 随机微分方程,用于模拟包含随机性过程的微分方程。在扩散模型中,用于描述数据逐渐被噪声破坏的过程。
Diffusion Models 扩散模型,一类生成式模型,通过学习逆转一个逐渐向数据中添加噪声的过程来生成新数据(如图片、分子)。
MOFs (Metal-Organic Frameworks) 金属有机框架,一类由金属离子/团簇与有机配体连接形成的多孔晶体材料,因其超高的比表面积,在气体吸附、分离、催化等领域前景广阔。
GCMC (Grand Canonical Monte Carlo) 巨正则系综蒙特卡洛模拟,一种用于模拟在恒定化学势、体积和温度下,流体分子在多孔材料中吸附行为的统计力学方法。
Bitter Lesson “苦涩的教训”,由 Richard Sutton 提出的观点,认为 AI 研究的历史表明,利用海量计算的长处、通用方法最终总是优于基于特定领域人类知识的精巧方法。
Uncertainty Prediction / Quantification 不确定性预测/量化,使机器学习模型不仅能给出预测结果,还能给出该结果的置信度或误差范围,对于识别模型是否在其训练数据覆盖域内运行至关重要。
Active Learning Loop 主动学习循环,一种迭代训练策略,模型主动识别出自己预测不确定性高的数据点,并由专家(人或实验)进行标注或产生新数据,然后使用新数据重新训练模型。
Sovereign Stack 主权堆栈,指一个国家或地区在关键技术上拥有独立自主、不受制于他人的完整技术体系,如独立的芯片设计制造、基础大模型、核心软件等。

延伸思考

  1. 计算服务商的战略转型:Max Welling 明确指出物理 AI 负载(如 DFT 计算)与当前主流的 LLM 训练/推理负载完全不同,可能需要 CPU、ASIC 等异构计算资源。这对 Nebius 等云计算公司的数据中心硬件采购和产品设计提出了挑战:是坚守 GPU,还是提前布局为一站式“科学计算平台”提供异构算力?
  2. “硅基科学家”的崛起:Cos AI 平台展示的工作流本质上是提炼和自动化了顶尖化学家的思维模式(查询数据库、生成候选、设计实验、反馈迭代)。这种“AI 科学家”的泛化能力边界在哪里?它会在多久后从辅助工具发展为能做出颠覆性科学假设和发现的“第一作者”?这将对科研伦理和科学共同体组织形态产生何种冲击?
  3. 数据飞轮的壁垒:Max Welling 强调所有数据最终都会回流到 Cos AI 的数据库中,这意味着平台用得越多,其模拟器和预测器就越强、越快。这种“数据-模型”飞轮是否会让先发者形成赢家通吃的垄断地位?这与科学界倡导的开放科学、数据共享原则应如何平衡?
  4. 物理先验的回归:虽然“苦涩的教训”强调大数据和大算力,但 Max Welling 也指出在数据稀缺的具体科学问题上,物理先验(等变性、对称性等)仍然是决定模型效率的关键。这是否意味着下一代 AI 架构(尤其在科学领域)将是 Transformer 等通用架构与强物理约束的深度融合,而非纯粹的“大力出奇迹”?
  5. 从“挖矿”到“炼矿”:演讲中提到了从海水中低成本提取锂的设想。这代表了材料科学的一个高阶范式转移:从被动地寻找天然存在的新材料,过渡到主动设计从稀薄资源中高效获取目标物质的过程。如果此类技术成熟,将可能彻底颠覆全球资源分布、地缘政治和供应链格局。

原文发表:May 05, 2026  ·  纪要生成:2026-06-25