AI 驱动材料发现：从物理世界到创业前线 | AI4Science 社区早餐会

来源： YouTube | Max Welling | Oct 22, 2025 分类： 其他 原文发表： Oct 22, 2025 纪要生成： 2026-06-25

全集重点

从量子引力到万亿参数 AI：Max Welling 的职业轨迹体现了从理论物理到机器学习，再到 AI for Science 创业的范式转移，强调了“先学最难的（数学/物理）”这一核心建议。
CUSP AI 平台：构建一个“材料搜索引擎”式的智能体平台，通过生成、模拟、验证和筛选的闭环，实现新材料（如碳捕获吸附剂）的按需创造。
合成性是最大瓶颈：在硅基（in silico）发现新材料相对容易，但预测其可合成性、可规模化生产及最终被市场采纳，是当前 AI 材料发现面临的最大挑战。
欧洲创业的“缩放”困境：欧洲拥有顶尖人才和早期支持，但初创企业在规模化阶段常面临法律碎片化、市场壁垒等障碍，被迫转向美国市场。
LLM 的能力辩论：Max Welling 对未经微调的大语言模型（LLM）能否自主协调整个科学发现流程持怀疑态度，认为仍需通过强化学习（RL）进行专门训练，但对 LLM 的持续进化能力保持开放心态。

嘉宾/话题简介

Max Welling 是 CUSP AI 的联合创始人兼 CTO，一位理论物理学家出身的机器学习先驱。他的职业生涯始于量子引力研究，后转向机器学习领域，曾在加州、加拿大和英国的学术界任职，并先后在高通（Qualcomm）和微软研究院（Microsoft Research）领导 AI for Science 相关研究。约 19 个月前，他正式创立 CUSP AI，专注于利用 AI 平台发现和设计新材料，特别是应用于碳捕获、电池等可持续发展领域。本集节目是 AI4Science 社区早餐会的现场对话，Max 深入分享了他从学术研究到创业的转变、CUSP 的技术平台细节、AI 在物理世界落地的挑战，以及对欧洲深科技创业环境的深刻洞察。

分节详述

[00:00] 开场与 Max Welling 的职业轨迹

本节重点

Max Welling 自我介绍：从理论物理（量子引力）到机器学习的学术与工业界转变。
关键转折点：量子引力研究缺乏改变世界的影响力，促使其转向当时尚属小众的机器学习领域。
职业路径回顾：从加州、加拿大、英国的学术教职，到回到荷兰创立并被高通收购的初创公司，再到微软研究院，最终创立 CUSP AI。

详细精要

学术背景与转型动机：一句话概括：Max Welling 是理论物理学家出身，博士期间专注于量子引力。
他直言放弃量子引力的原因是：“that wasn't going to change the world”（那不会改变世界），这促使他转向机器学习。
转型时机：他进入机器学习领域时，该领域还非常不起眼（very unassuming field），模型只有 10到100个参数，与如今动辄万亿参数的规模形成指数级对比。
这种从极少数参数到海量参数的跨越，被他称为真正的“exponential scaling”（指数级缩放）。
工业界与学术界的跨界经历：一句话概括：Max 经历了从纯学术到学术与工业界交融的完整路径。
完成学业后，他先后在加州、加拿大和英国的机器学习系担任教职。
2013年，他回到荷兰，在担任教职的同时创立了一家初创公司，该公司后被高通（Qualcomm）收购。
在高通位于阿姆斯特丹的研究院工作了四年，但无线通信并非其兴趣所在。
转折点：当时 AI for Science 开始兴起，他本想再次创业，但接到了 Chris Bishop（微软研究院）的电话，邀请他在阿姆斯特丹建立一个 AI for Science 实验室，他无法拒绝这个提议。
在微软工作两年后，创业的冲动过于强烈（the itch of a startup was too strong and it needed to be scratched），最终在约19个月前联合创立了 CUSP AI。

💬 精华片段（中文）

“我在加州、加拿大和英国的机器学习系任职过……2013年我回到荷兰……创业的冲动太强烈了，必须去挠一挠，所以大约19个月前，我们正式创立了CUSP AI。” “I've been m in the machine learning faculty basically in California and Canada and U and UK... and so about uh I would say one now at 19 months ago now we officially um founded caspai which is AF for science but more precisely AF for materials.”

[03:06] 核心转折：从数字空间到物理世界的“灵光一现”

本节重点

最具决定性的想法：等变神经网络（Equivariant Neural Networks） 与分子力场的结合。
核心原理：将物理学中的对称性（如旋转、平移不变性）作为先验知识（prior）嵌入神经网络，而不是让网络从零开始学习。
这一结合让他意识到 AI 可以回归并加速物理/化学的基础发现，而非仅仅是数字世界的发明。

详细精要

等变神经网络的开发背景：一句话概括：在高通期间，Max 与 Taco Cohen、Maurice Weiler 等人合作开发了等变神经网络。
该网络的核心理念是告诉神经网络世界的对称性。例如，当你旋转一张图像时，其分割结果也应以相同方式旋转。
如果仅靠数据训练，神经网络无法自然“理解”这种对称性。
这是一种将人类已知的物理规律作为归纳偏置（inductive bias） 直接编码进模型结构的方法。
与分子力场的“美丽”连接：一句话概括：等变神经网络被应用于构建机器学习力场（Machine Learning Force Fields），用于分子模拟，这成为 AI 在化学/物理中最成功的应用之一。
他发现分子世界中的对称性近乎完美（如果忽略重力）。
具体例子：移动或旋转一个分子，其基态能量（ground state energy）保持不变，而力则会随分子的旋转而旋转。
这种将机器学习工具（等变网络）应用于解决真正的化学问题，让他感到“that's very beautiful”，因为这连接回了他的理论物理根源。
他认为机器学习力场是目前机器学习被整合进物理或化学领域最成功的方式，甚至预测其未来有获得诺贝尔化学奖的潜力。
这一时刻标志着他决定从发明新事物转向利用 AI 去“discovering the world”（发现世界），弄清楚世界是如何运作的。

💬 精华片段（中文）

“我当时想，这太美了，因为这实际上是一个对称性近乎完美的真实案例……它连接回了我的根源，即理论物理。” “I thought, okay, that's beautiful because this is an actual example where the symmetry is almost perfect... that connected back to my roots which was theoretical physics.”

[06:16] CUSP AI 平台技术架构解密

本节重点

CUSP AI 是一个通用材料发现平台，首个内部项目是碳捕获吸附剂（Skyalt），也覆盖燃料电池、水净化等。
平台本质：一个搜索与优化引擎，由智能体（agent）协调整个流程。
核心工作流：数据检索 → 主动学习生成数据 → 模型微调 → 生成候选材料 → 多层级验证（从物理规则到MD/MC模拟）→ 宏观建模与经济分析。

详细精要

平台的通用性与应用领域：一句话概括：CUSP 的平台比碳捕获更通用，但其所有项目都带有可持续发展（sustainability）的角度。
内部旗舰项目Skyalt 旨在寻找新型碳捕获吸附剂（sorbent）。
其他应用包括燃料电池（fuel cells）、去除水中有害物质等。
平台的交互方式类似于搜索引擎，用户在类似提示框（prompt）的界面输入所需材料类型和属性。
智能体驱动的多步骤工作流：一句话概括：平台的核心是一个协调搜索和计算的智能体（agent）。
第一步：数据检索。智能体首先会查找已有数据，包括内部数据湖（data hold）、互联网、公共结构化数据库（如 Nomad、Materials Project）。
第二步：主动学习数据生成。如果数据不足，会启动DFT（密度泛函理论）计算。这里使用了一个由柏林团队（Felix Musil等）开发的主动学习循环（active learning loop），它只生成对构建数据库最必要的数据点，而非盲目计算。
第三步：模型微调。利用新生成的数据库对通用机器学习模型进行针对特定材料类别（如电解质）的微调（fine-tune）。
生成、验证与多尺度模拟链：一句话概括：候选材料的生成和验证是一个层层升级、计算成本逐渐升高的多阶段过程。
生成模型：使用类似生成图像的模型来生成新的分子或材料。
物理可行性快速筛查：生成后，会有一整套检测器（detectors）快速判断候选物是否满足基本物理规律，例如：是否带电、体积是否足够（针对碳捕获）、在特定温度下是否会坍塌等。
多尺度模拟升级：
- 廉价层：属性预测器（property predictors）。
- 昂贵层：开始进行 MD（分子动力学） 和 MC（蒙特卡洛） 模拟以计算更复杂的属性。例如，计算 CO2 分子在吸附剂内部的吸附效果，传统 MC 模拟非常慢（可能需要数天），团队（Nick 和 Yonas）已将其加速并部署到 GPU 上。
更宏观的建模：最终需要建立数字孪生（digital twin）模型，模拟材料在真实碳捕获装置中的表现，并最终进行技术经济分析（technoeconomic considerations）和生命周期分析（life cycle analysis），评估其商业可行性和环境影响。

💬 精华片段（中文）

“你可以在某种程度上将其视为一个搜索引擎，你在查询框中输入你感兴趣的材料类型和属性……然后后台会有一个智能体协调搜索和计算。” “you can think of it as a search engine where you literally type like the type of material and the properties of that material that you're interested in in some kind of query box... there is an agent that will coordinate the search and the computations.”

[11:28] AI for Science 的宏大机遇与根本挑战

本节重点

AI for Science 面临的关键社会和经济机遇：芯片材料、能源转型（电池）、气候变化（碳捕获）、水净化等。
核心观点：几乎所有问题的根源都是材料问题。终极愿景是实现 “按需造物”（create materials on demand）。
AI for Science 的核心挑战：学术界倾向于只发表成功案例，导致机器学习所需的失败数据极度缺乏。

详细精要

材料的根本性地位：一句话概括：Max Welling 认为，几乎所有行业进步的底层都是材料科学的突破。
芯片领域：芯片由众多不同材料层叠而成，制造工艺已逼近仅几个原子大小的“量子墙”，亟需新材料提升性能。
能源转型：电池是能源转型中显而易见的关键材料问题。
环境挑战：碳捕获（直接空气捕获）、水供应中有毒物质的过滤等。
在制造业中，从汽车到各种产品，所有涉及的材料都有改进空间。因此，终极目标是实现告诉 AI 你的需求，它就能创造出相应材料的愿景。
数据匮乏的困境：一句话概括：相比大语言模型（LLM）的数据充裕，AI for Science 面临严峻的数据短缺问题。
Max 将数据分为三类：公开数据库（如 Nomad, Materials Project）、自行生成的计算数据、实验数据。
公开数据“太少” （way too little）。根本原因在于化学家的习惯：只发表成功的实验和计算结果。
他强调，为了机器学习，科学界应养成保存一切数据（包括失败数据）的习惯，因为这些“负面数据点”对模型训练非常有价值。
自行生成的计算数据虽然高质量但成本昂贵。自行生成的实验数据则非常慢，他们正试图转向高通量（high throughput）实验。

💬 精华片段（中文）

“化学家们习惯于只发表成功的实验和计算……我们应该养成保存一切的习惯，这对机器学习来说真的非常有用。” “chemists have the habit of only uh sort of publishing the successful um kind of experiments and computations and we should get into the habit of actually saving everything which for machine learning is really very useful.”

[14:11] 问答环节：数据、3D 几何与物理有效性

本节重点

数据质与量仍需大幅提升，公开数据库（如Nomad）至关重要。
3D 几何与等变表示：并非生死攸关，但能降低预测难度，是一种有益的归纳偏置。
物理有效性与合成性：存在一个由各种物理检查构成的“动物园”（如“floppy MOF detector”），但合成性仍是核心难题。
从计算到实验室的闭环（实验设计优化）是未来趋势。

详细精要

关于数据量的问题（Sar, Nomad）：Max 回应数据分为公开、自生成计算、自生成实验三类。公开数据太少，需要更多像 Nomad 这样的数据库。
计算数据可控但昂贵。
实验数据生成慢，他们在 Skyalt 项目末期才合成了少量材料，对实验数据的高通量质量尚缺经验。结论是团队始终极度渴求（completely hungry）更多、更好的数据。
关于3D几何与等变性的问题：Max 解释，计算中的数据自动是3D的（原子位置和类型），问题在于其表示是否等变（equivariant）。
等变表示通过将重要的先验知识（物理对称性）编码进模型，能更容易地预测属性。
但他认为这并非关键，只是因为数据不足，所以利用归纳偏置有好处，但“I don't think it's that key”，没有它，科学和平台建设工作依然可以进行。
关于保证物理有效性和可合成性的问题：Max 指出，预测可合成性（synthesizability）是最大挑战之一。
他们在生成金属有机框架（MOFs）时发现，许多结构看起来不错，但轻微晃动（模拟）就会坍塌。为此他们开发了一个名为“floppy MOF detector”的工具来检测结构稳定性。
合成性仍然很“玄学”。他分享了一个故事：有实验室发表了MOF合成方法，其他实验室却无法复现，即使原作者亲自过去也未能成功，最终发现是大气成分的微小差异导致了失败。从文献中预测这些几无可能。
解决方案之一是反转流程：先进高通量和自驱动实验室（self-driving labs）大规模合成，再去测量和反推。
未来趋势在于将计算和实验室连接起来，不仅仅是做贝叶斯优化（Bayesian optimization），而是利用AI加速的计算模拟来预测下一个最佳实验，从而更快地迭代实验设计。

💬 精华片段（中文）

“如果晃动它们一下，很多都会坍塌……你可以用电脑来模拟这个，这非常有意思。所以我们建了一个工具，叫‘floppy MOF detector’。” “if you shake them a little bit, many of them collapse... we actually built a tool which is called floppy moth. And the floppy moth detector basically took a moth and it would shake it a little bit and then would say would it collapse? Yes or no?”

[21:34] 被忽视的研究领域、论文推荐与 LLM 的边界

本节重点

被忽视的领域：化学工业界本身对模拟和 AI 的采纳度极低，这与前沿研究脱节。
对 LLM 的矛盾心态：对其能力感到震撼，又对其能否处理精确的科学数字和自主规划整个平台流程深表怀疑。
核心问题：未经微调的 LLM 能否仅凭工具描述和最终目标，就聪明到能自主解决科学问题？

详细精要

被忽视的研究领域：Max 认为整个 AI for Science 领域其实还很小，大约一年前才开始真正成长。最被忽视的是，绝大多数化学公司甚至没有在模拟，更不用说使用 AI 来加速模拟了。他认为工业界在这方面远远落后，但这种状况会迅速改变。
对 LLM 的矛盾心态与能力边界：Max 坦言自己时常在两种状态间切换，一方面被 LLM 的能力震撼，觉得不可思议；另一方面又觉得它并不真正聪明，输出的内容可能是“垃圾”。
这对 CUSP 至关重要，因为他们尝试用 LLM 作为使用工具的智能体来操控整个平台。
内在困难：LLM 对数字的感觉不强烈（doesn't have a very strong sense of numbers），必须依赖调用外部工具。
核心怀疑：他无法想象一个未经专门训练的 LLM，仅通过阅读工具描述和接收最终目标奖励，就能比一个贝叶斯优化器更聪明地解决材料发现问题。
他相信通过强化学习（RL）让模型在大量尝试中学习，是肯定可以解决任务的，但这极其昂贵。真正的悬念在于，一个完全没经过此流程训练的“开箱即用”的LLM，能否展现出同等的智能。
提问与补充（Nikolola, Rubik's Code）：针对 Max 的怀疑，提问者询问是否更小的、专门训练的模型会比直接“硬上”LLM效果更好。
Max 完全同意。他认为一个针对任务进行 RL 训练的较小模型会表现出色。
他不愿意做那种总是否认技术进步的人，因为 LLM 和 AlphaGo 的成功都曾让他感到震撼。
关于 AI 科学家与“进化”的问题（Juan, Data Engineer）：提问者提到谷歌的 AI co-scientist，它可以提出并演化假设，这与 CUSP 生成-验证-再生成的演化闭环思路很相似，想了解 CUSP 如何处理这个瓶颈。
Max 确认 AI co-scientist 这类工具很有用。
他点出提示工程（prompt engineering）的重要性超乎想象。LLM 可以被引导至类似人类的“心理状态（psychological state）”，表现出截然不同的行为。
CUSP 的平台正是遵循“生成-评估-再生成”的演化范式来工作的。

💬 精华片段（中文）

“我无法想象一个仅仅在通用数据上训练出的LLM，能聪明到将这些工具串联起来……然后变得比一个贝叶斯优化器更聪明。我无法想象，但我们在构建它们，我很乐意被惊喜。” “I cannot imagine that's the case but we are building them and um I'm I'm super happy to be pleasantly surprised.”

[30:00] 从实验室到市场：创业的最大障碍

本节重点

最大障碍一：可合成性、规模化生产以及预测后期整合问题。
最大障碍二（甚至更重要）：说服客户使用并为之付费，因为化工行业极为保守且利润率低。
欧洲创业生态：初创阶段好，但规模化（scaling）阶段困难重重，常被投资者建议迁往美国。

详细精要

从硅基设计到现实世界的两大障碍：Max 认为，创业以来面临的最大障碍并非基础科学。
障碍一：制造端。能否真正大规模制造（manufacture this material at scale）出这种材料，以及能否预测后续整合过程中的种种问题。
障碍二：市场端。谁会用并且付钱？化工行业相当保守，利润率极低，导致研发预算很少。他认为需要用成功案例“撬开”这个行业，一旦他们看到效益，就会蜂拥而入。
欧洲创业的“幸”与“不幸”：Max 对欧洲的优劣势有清晰判断。
优势：欧洲有非常好的人才，启动初创公司也相对容易，政府对从实验室到初创阶段的扶持（如本次活动所在的大楼）做得很好。
劣势：后续的规模化（scaling）部分非常困难。投资人的标准建议是“你需要去美国才能规模化”。这使得由欧洲人才、政府投资孵化的公司，最终在美国成长并让美国受益，这令人沮丧。
法律与市场碎片化：举例说明，初创公司与不同国家的实验室签合同时，会因为合同应基于英国法还是丹麦法而产生巨大法律成本，他质疑为何没有一套统一的初创企业法律。另一个例子是，在英国创业的公司，若要和德国大公司做生意，可能被要求在德国设立子公司。这些摩擦成本对资源有限的初创公司来说是沉重负担。

💬 精华片段（中文）

“我们到底为什么没有一套针对初创公司的统一法律体系？……一个在其他国家的初创公司，为了在德国做生意，得先在这里建一个公司，这有点太过了。” “Why is there not one set of laws for startups for instance right... for a startup in another country to build a company here first in in order to do business in in in in Germany is like it's like too much.”

[35:15] 职业建议、成功叙事与企业文化

本节重点

职业发展建议：“先做最难的事”，如先学数学和物理，再学 ML，并保持快速切换和适应的能力。
推动科学界采纳 AI：需要展示更多惊人的突破（如首个纯 AI 设计的材料），并提供低门槛教育资源。
失败的价值：核心不在于避免失败，而在于快速从失败中恢复并将其转化为学习点。
企业文化：持续自我质疑、保持敏捷、强大的创始团队和良好的文化。

详细精要

给年轻人的学习路径建议：Max 建议年轻人先做最难的事。
技能优先级：先学数学，其次是量子力学等最难的学科。年轻时更有耐心去完成这些复杂的推导。
机器学习本身数学上不算特别难，有了扎实的数学或物理基础，可以相对容易地掌握。
随着时代快速变化，最重要的是学会快速切换（switch quickly）和快速适应（adapt quickly），不要在一个非常具体的领域挖得太深。
关于说服科学界采纳 AI（Ola 提问）：Max 认为最直接的方式是展示成功案例。
业界需要“第一个由 AI 完全设计的材料”这种级别的突破来作为展示。
同时需要降低进入门槛，例如提供优质的在线课程，以及通过欧洲的“AI 工厂（AI factories）”提供 GPU 算力支持。
成功的榜样和故事也能吸引大量人才进入该领域。
关于失败与成功（Jill 提问）：Max 认为常态是“人人都在失败”，关键是如何学习。
失败提供了一个非常有效的负面数据点，能加速学习。真正的失败是你从此放弃了。他以教孩子骑自行车为例，孩子会不断摔倒，但马上又爬起来继续，直到成功。
在 CUSP，目前还没遇到过完全失败的项目。但他分享了一个个人研究中的失败案例：试图通过计算“区间”来完美捕捉预测的不确定性，结果区间变得毫无意义地大，无法控制。他反思，学会适时停手（the art of stopping in time）本身就是一个需要掌握的技能，因为很难判断是该继续坚持还是承认这是个坏主意。
发明 vs. 优化材料：Max 选择发明（invent）新事物。
这也是他们平台所做的，不仅仅是搜索已有的。
他对创造力的理解是：以令人惊讶的新方式组合现有小模块，这本质上也是一种优化。
关于 CUSP 的竞争定位与文化（Finantandant 提问）：Max（像对投资人陈述般）为 CUSP 的护城河和公司建设哲学做了总结。
关键壁垒：数据是最重要的护城河，因为获取和生成数据的成本和精力巨大。但其他方面并非不可复制。
成功公司的要素：
1. 文化（Culture）：让员工感到工作的快乐和意义，致力于解决有意义的问题。
2. 敏捷性（Agility）：能够轻松转型，因为不可能从一开始就规划好一切，必须不断自我质疑并做出正确调整。
3. 创始团队：极其重要，需要能融洽合作，避免过度的自负导致团队分裂。
4. 整合的难度：将整个复杂平台搭建起来并使其正常运行本身就构成极高的技术壁垒。
他承认最终这仍会是一场竞赛，就像 LLM 领域一样。

💬 精华片段（中文）

“我常说，这不是关于失败，而是关于你多快能从失败中恢复过来……失败是一个非常独特的学习之地，因为你有了一个非常好的负面数据点。” “it's not about failing, it's about how quickly can you recover from failing... failing is a unique place where you can learn um a lot at that point because you have a very good negative data point.”

[48:51] 深度技术讨论：AI 模型在科学中的泛化与验证

本节重点

验证（Verification）：对物理/化学而言相对简单，因为存在已知的物理定律和数十年来开发的计算工具（验证栈），AI 更多是加速这一过程。
生成（Generation）与泛化（Generalization）：模型难以泛化到远离已知数据分布的全新结构，需要通过“探索-验证-重训练”的循环来引导。
归纳偏置的重要性：在生成过程中注入大量的物理先验知识（如其 MOF 生成模型的做法），以保证产物的合理性。

详细精要

针对验证问题（Mo, Apple 提问）：一位来自苹果的提问者指出，在科学领域，模型泛化到全新场景以及验证生成结果的可学习性，是两大挑战。
Max 回应，验证对于物理/化学来说可能简单得多，因为他们知道物理定律。化学家和物理学家几十年来已经构建了一整套评估体系（evaluation stack），包括各种规则检测器和模拟工具。CUSP 所做的更多是用 AI 加速这些已有的验证流程。
针对泛化问题的解答路径：Max 详细解释了应对泛化难题的策略。
现状：像 Google 的 GNoME、微软的 MatterGen 以及 CUSP 自己的模型，在已知数据区域表现良好。
挑战：模型越向未知领域（fringe）探索，越可能生成违反物理规律的材料，生成正确结果的难度越大。
解决策略：
1. 引导而非漫游：首先用已知数据训练模型，使其主要在已知点之间内插。然后，有目的地推动它向感兴趣的方向（数据稀疏的边缘）探索。
2. 生成-验证闭环：对边缘探索产生的结果持续进行验证，过滤出正确的、有价值的新数据点。
3. 重训练以拓展边界：利用这些新数据重新训练生成模型，使其“学会”在新区域中生成合理产物，从而一步步地向目标材料靠近。
4. 注入强归纳偏置：CUSP 的一个早期 MOF 生成模型，模型本身只生成组件及其大致位置，然后由另一个基于大量物理知识编写的确定性代码来将这些组件组合成最终的三维实例。这是一种非常强大的、非模型学习的先验知识注入方式。

💬 精华片段（中文）

“你离已知区域越远，就越可能破坏物理规律……所以它就像一个生成-验证-再训练的工作流，一步步地向你感兴趣的材料逼近。” “the further you go away the more likely you break physics and so the harder it gets... you keep verifying... retrain your generative models in this area and so you sort work your way towards the material that you're interested in.”

[53:03] 现状、成功定义与闭幕

本节重点

行业现状：尚无一个 100% 由 AI 设计并取得重大成功的突破性新材料，已有成果多为对现有材料的改进。
CUSP 的成功定义：与公司合作，将其设计的材料大规模生产并投入实际产品中，而不仅仅是发论文。
已合作的领域包括碳捕获 MOF 的改进，但尚未达到“巨大成功”的标准。

详细精要

关于已有成功案例的提问（OA 提问）：一位观众询问 CUSP 是否已有成功开发的、完全不存在的新材料，或与公司合作的具体成功。
Max 坦诚，在 CUSP 成立19个月的时间里，以及在整个行业内，他还没有看到一个完全由 AI 生成并取得成功的材料，尽管有一些相关宣称。
CUSP 的现有路径更多是在改进现有的金属有机框架（MOF），以用于碳捕获，但这还不能称为巨大成功。
他预测，最先看到的成功可能会是对现有材料的微小改进或优化的配方（formulations），例如更好的油漆、涂料等。在这些领域，AI 可能已经得到应用。
至于全新的高温超导体这类颠覆性材料，AI 还远未能设计出来。
CUSP 对“成功”的定义：Max 明确区分了学术成功与商业成功。
发表论文是教育全世界的好事，但对 CUSP 来说不算是成功。
真正的成功是：一家公司采用了他们的设计，大规模生产，并将其整合到最终销售的产品中。只有当一种材料真正进入现实世界时，才算成功。

专业术语注释

术语	解释
AI for Science	指利用人工智能技术，特别是机器学习，来解决基础科学领域（如物理、化学、生物）研究问题的新兴交叉学科。
等变神经网络 (Equivariant Neural Networks)	一种能够将输入数据（如分子）的对称性变换（如旋转、平移）直接反映在其输出（如预测力场）上的神经网络结构，减少了模型需要学习的复杂度。
机器学习力场 (Machine Learning Force Fields)	利用机器学习模型来高精度且快速地预测原子间作用力和体系能量，以替代计算昂贵的传统量子力学方法（如 DFT），用于分子动力学模拟。
DFT (密度泛函理论)	一种用于研究多电子体系电子结构的量子力学计算方法，是计算材料科学和化学领域的标准工具，但计算成本高。
金属有机框架 (MOFs, Metal-Organic Frameworks)	一类由金属离子与有机配体自组装形成的多孔晶体材料，在气体存储、分离和催化等方面具有巨大应用潜力，是本案例中讨论的核心材料之一。
Floppy MOF Detector	CUSP 团队开发的一个内部工具，通过模拟晃动来快速检测生成的 MOF 结构是否稳定，是否会坍塌。
主动学习 (Active Learning)	一种机器学习范式，模型能够主动选择最“有用”的下一个数据点来请求标签（或计算），从而用更少的数据达到更好的性能，在此用于高效生成计算数据。
MD (分子动力学)	一种计算机模拟方法，通过数值求解牛顿运动方程来研究原子和分子在特定条件下的物理运动和相互作用。
MC / 蒙特卡洛模拟	一种基于随机采样的计算方法，常用于模拟分子在不同位点的吸附、扩散等过程，在计算材料吸附属性（如 CO2 吸附能）时常用。
贝叶斯优化 (Bayesian Optimization)	一种用于优化昂贵黑箱函数的高效全局优化策略，常用于自动化实验设计中，通过已测量数据来决策下一个最有价值的实验参数。
强化学习 (RL, Reinforcement Learning)	一种机器学习方法，智能体（agent）通过与环境交互并接收奖励/惩罚信号来学习最佳行动策略，Max 认为用它来训练一个能操控整个科研平台的智能体是可行的。
LLM (大语言模型)	如 GPT、Claude 等的大规模语言模型，Max 正在探索其作为“智能体”来协调整个材料发现平台的能力，但对其实用性持审慎态度。
归纳偏置 (Inductive Bias)	指机器学习算法为了“偏好”某些假设而做出的一系列假设。本案例中指将物理对称性、分子组合规则等已知知识硬编码进模型，以提升学习效率。

延伸思考

数据稀缺的商业模式：如果数据是 AI for Science 最大的护城河，是否会催生出专门从事高价值科学数据生成、清洗和交易的“科学数据商”？像 Nomad 这样的公共数据库未来如何在与企业专有数据的竞争中保持其价值和盈利模式？
LLM 作为科学家的终极形态：Max Welling 对 LLM 的怀疑是深刻的。一个折中的路径是，未来顶尖的 AI 科学系统可能是由经过精细微调的 LLM 作为“大脑”，与一个由强化学习训练的、动作极快的“小脑”协同工作，两者的交互边界在哪里？
合成之殇与工艺的价值：既然合成性是最大瓶颈，那么在 AI 材料发现赛道中，率先布局 自驱动实验室 和 高通量实验 的企业是否能获得绝对优势？这可能会将竞争从纯粹的算法硅基竞赛，重新拉回到需要深厚物理积累的湿实验和工艺工程上。
欧洲的“失去的十年”：Max 指出的欧洲初创企业规模化困境，是否会使欧洲在未来十到二十年的深科技供应链中，再次沦为“创新的摇篮，产业的墓场”？资金和市场的一体化何时能跟上人才和政策的步伐？
创造力是组合还是涌现：Max 将发现新材料的创造力定义为“以令人惊讶的方式组合现有模块”，这与当前扩散模型（Diffusion Model）或生成式模型的运作原理非常契合。但这是否意味着 AI 永远只能做“混合者”而非“发明家”？一种从未在数据和理论上出现的“涌现”式全新材料结构，能否通过 AI 产生？

原文发表：Oct 22, 2025 · 纪要生成：2026-06-25