来源: YouTube | Max Welling | Oct 22, 2025 分类: 其他 原文发表: Oct 22, 2025 纪要生成: 2026-06-25
Max Welling 是 CUSP AI 的联合创始人兼 CTO,一位理论物理学家出身的机器学习先驱。他的职业生涯始于量子引力研究,后转向机器学习领域,曾在加州、加拿大和英国的学术界任职,并先后在高通(Qualcomm)和微软研究院(Microsoft Research)领导 AI for Science 相关研究。约 19 个月前,他正式创立 CUSP AI,专注于利用 AI 平台发现和设计新材料,特别是应用于碳捕获、电池等可持续发展领域。本集节目是 AI4Science 社区早餐会的现场对话,Max 深入分享了他从学术研究到创业的转变、CUSP 的技术平台细节、AI 在物理世界落地的挑战,以及对欧洲深科技创业环境的深刻洞察。
本节重点
详细精要
这种从极少数参数到海量参数的跨越,被他称为真正的“exponential scaling”(指数级缩放)。
工业界与学术界的跨界经历:一句话概括:Max 经历了从纯学术到学术与工业界交融的完整路径。
💬 精华片段(中文)
“我在加州、加拿大和英国的机器学习系任职过……2013年我回到荷兰……创业的冲动太强烈了,必须去挠一挠,所以大约19个月前,我们正式创立了CUSP AI。” “I've been m in the machine learning faculty basically in California and Canada and U and UK... and so about uh I would say one now at 19 months ago now we officially um founded caspai which is AF for science but more precisely AF for materials.”
本节重点
详细精要
这是一种将人类已知的物理规律作为归纳偏置(inductive bias) 直接编码进模型结构的方法。
与分子力场的“美丽”连接:一句话概括:等变神经网络被应用于构建机器学习力场(Machine Learning Force Fields),用于分子模拟,这成为 AI 在化学/物理中最成功的应用之一。
💬 精华片段(中文)
“我当时想,这太美了,因为这实际上是一个对称性近乎完美的真实案例……它连接回了我的根源,即理论物理。” “I thought, okay, that's beautiful because this is an actual example where the symmetry is almost perfect... that connected back to my roots which was theoretical physics.”
本节重点
详细精要
平台的交互方式类似于搜索引擎,用户在类似提示框(prompt)的界面输入所需材料类型和属性。
智能体驱动的多步骤工作流:一句话概括:平台的核心是一个协调搜索和计算的智能体(agent)。
第三步:模型微调。利用新生成的数据库对通用机器学习模型进行针对特定材料类别(如电解质)的微调(fine-tune)。
生成、验证与多尺度模拟链:一句话概括:候选材料的生成和验证是一个层层升级、计算成本逐渐升高的多阶段过程。
💬 精华片段(中文)
“你可以在某种程度上将其视为一个搜索引擎,你在查询框中输入你感兴趣的材料类型和属性……然后后台会有一个智能体协调搜索和计算。” “you can think of it as a search engine where you literally type like the type of material and the properties of that material that you're interested in in some kind of query box... there is an agent that will coordinate the search and the computations.”
本节重点
详细精要
在制造业中,从汽车到各种产品,所有涉及的材料都有改进空间。因此,终极目标是实现告诉 AI 你的需求,它就能创造出相应材料的愿景。
数据匮乏的困境:一句话概括:相比大语言模型(LLM)的数据充裕,AI for Science 面临严峻的数据短缺问题。
💬 精华片段(中文)
“化学家们习惯于只发表成功的实验和计算……我们应该养成保存一切的习惯,这对机器学习来说真的非常有用。” “chemists have the habit of only uh sort of publishing the successful um kind of experiments and computations and we should get into the habit of actually saving everything which for machine learning is really very useful.”
本节重点
详细精要
实验数据生成慢,他们在 Skyalt 项目末期才合成了少量材料,对实验数据的高通量质量尚缺经验。结论是团队始终极度渴求(completely hungry)更多、更好的数据。
关于3D几何与等变性的问题:Max 解释,计算中的数据自动是3D的(原子位置和类型),问题在于其表示是否等变(equivariant)。
但他认为这并非关键,只是因为数据不足,所以利用归纳偏置有好处,但“I don't think it's that key”,没有它,科学和平台建设工作依然可以进行。
关于保证物理有效性和可合成性的问题:Max 指出,预测可合成性(synthesizability)是最大挑战之一。
💬 精华片段(中文)
“如果晃动它们一下,很多都会坍塌……你可以用电脑来模拟这个,这非常有意思。所以我们建了一个工具,叫‘floppy MOF detector’。” “if you shake them a little bit, many of them collapse... we actually built a tool which is called floppy moth. And the floppy moth detector basically took a moth and it would shake it a little bit and then would say would it collapse? Yes or no?”
本节重点
详细精要
被忽视的研究领域:Max 认为整个 AI for Science 领域其实还很小,大约一年前才开始真正成长。最被忽视的是,绝大多数化学公司甚至没有在模拟,更不用说使用 AI 来加速模拟了。他认为工业界在这方面远远落后,但这种状况会迅速改变。
对 LLM 的矛盾心态与能力边界:Max 坦言自己时常在两种状态间切换,一方面被 LLM 的能力震撼,觉得不可思议;另一方面又觉得它并不真正聪明,输出的内容可能是“垃圾”。
他相信通过强化学习(RL)让模型在大量尝试中学习,是肯定可以解决任务的,但这极其昂贵。真正的悬念在于,一个完全没经过此流程训练的“开箱即用”的LLM,能否展现出同等的智能。
提问与补充(Nikolola, Rubik's Code):针对 Max 的怀疑,提问者询问是否更小的、专门训练的模型会比直接“硬上”LLM效果更好。
他不愿意做那种总是否认技术进步的人,因为 LLM 和 AlphaGo 的成功都曾让他感到震撼。
关于 AI 科学家与“进化”的问题(Juan, Data Engineer):提问者提到谷歌的 AI co-scientist,它可以提出并演化假设,这与 CUSP 生成-验证-再生成的演化闭环思路很相似,想了解 CUSP 如何处理这个瓶颈。
💬 精华片段(中文)
“我无法想象一个仅仅在通用数据上训练出的LLM,能聪明到将这些工具串联起来……然后变得比一个贝叶斯优化器更聪明。我无法想象,但我们在构建它们,我很乐意被惊喜。” “I cannot imagine that's the case but we are building them and um I'm I'm super happy to be pleasantly surprised.”
本节重点
详细精要
障碍二:市场端。谁会用并且付钱?化工行业相当保守,利润率极低,导致研发预算很少。他认为需要用成功案例“撬开”这个行业,一旦他们看到效益,就会蜂拥而入。
欧洲创业的“幸”与“不幸”:Max 对欧洲的优劣势有清晰判断。
💬 精华片段(中文)
“我们到底为什么没有一套针对初创公司的统一法律体系?……一个在其他国家的初创公司,为了在德国做生意,得先在这里建一个公司,这有点太过了。” “Why is there not one set of laws for startups for instance right... for a startup in another country to build a company here first in in order to do business in in in in Germany is like it's like too much.”
本节重点
详细精要
随着时代快速变化,最重要的是学会快速切换(switch quickly)和快速适应(adapt quickly),不要在一个非常具体的领域挖得太深。
关于说服科学界采纳 AI(Ola 提问):Max 认为最直接的方式是展示成功案例。
成功的榜样和故事也能吸引大量人才进入该领域。
关于失败与成功(Jill 提问):Max 认为常态是“人人都在失败”,关键是如何学习。
在 CUSP,目前还没遇到过完全失败的项目。但他分享了一个个人研究中的失败案例:试图通过计算“区间”来完美捕捉预测的不确定性,结果区间变得毫无意义地大,无法控制。他反思,学会适时停手(the art of stopping in time)本身就是一个需要掌握的技能,因为很难判断是该继续坚持还是承认这是个坏主意。
发明 vs. 优化材料:Max 选择发明(invent)新事物。
他对创造力的理解是:以令人惊讶的新方式组合现有小模块,这本质上也是一种优化。
关于 CUSP 的竞争定位与文化(Finantandant 提问):Max(像对投资人陈述般)为 CUSP 的护城河和公司建设哲学做了总结。
💬 精华片段(中文)
“我常说,这不是关于失败,而是关于你多快能从失败中恢复过来……失败是一个非常独特的学习之地,因为你有了一个非常好的负面数据点。” “it's not about failing, it's about how quickly can you recover from failing... failing is a unique place where you can learn um a lot at that point because you have a very good negative data point.”
本节重点
详细精要
Max 回应,验证对于物理/化学来说可能简单得多,因为他们知道物理定律。化学家和物理学家几十年来已经构建了一整套评估体系(evaluation stack),包括各种规则检测器和模拟工具。CUSP 所做的更多是用 AI 加速这些已有的验证流程。
针对泛化问题的解答路径:Max 详细解释了应对泛化难题的策略。
💬 精华片段(中文)
“你离已知区域越远,就越可能破坏物理规律……所以它就像一个生成-验证-再训练的工作流,一步步地向你感兴趣的材料逼近。” “the further you go away the more likely you break physics and so the harder it gets... you keep verifying... retrain your generative models in this area and so you sort work your way towards the material that you're interested in.”
本节重点
详细精要
至于全新的高温超导体这类颠覆性材料,AI 还远未能设计出来。
CUSP 对“成功”的定义:Max 明确区分了学术成功与商业成功。
| 术语 | 解释 |
|---|---|
| AI for Science | 指利用人工智能技术,特别是机器学习,来解决基础科学领域(如物理、化学、生物)研究问题的新兴交叉学科。 |
| 等变神经网络 (Equivariant Neural Networks) | 一种能够将输入数据(如分子)的对称性变换(如旋转、平移)直接反映在其输出(如预测力场)上的神经网络结构,减少了模型需要学习的复杂度。 |
| 机器学习力场 (Machine Learning Force Fields) | 利用机器学习模型来高精度且快速地预测原子间作用力和体系能量,以替代计算昂贵的传统量子力学方法(如 DFT),用于分子动力学模拟。 |
| DFT (密度泛函理论) | 一种用于研究多电子体系电子结构的量子力学计算方法,是计算材料科学和化学领域的标准工具,但计算成本高。 |
| 金属有机框架 (MOFs, Metal-Organic Frameworks) | 一类由金属离子与有机配体自组装形成的多孔晶体材料,在气体存储、分离和催化等方面具有巨大应用潜力,是本案例中讨论的核心材料之一。 |
| Floppy MOF Detector | CUSP 团队开发的一个内部工具,通过模拟晃动来快速检测生成的 MOF 结构是否稳定,是否会坍塌。 |
| 主动学习 (Active Learning) | 一种机器学习范式,模型能够主动选择最“有用”的下一个数据点来请求标签(或计算),从而用更少的数据达到更好的性能,在此用于高效生成计算数据。 |
| MD (分子动力学) | 一种计算机模拟方法,通过数值求解牛顿运动方程来研究原子和分子在特定条件下的物理运动和相互作用。 |
| MC / 蒙特卡洛模拟 | 一种基于随机采样的计算方法,常用于模拟分子在不同位点的吸附、扩散等过程,在计算材料吸附属性(如 CO2 吸附能)时常用。 |
| 贝叶斯优化 (Bayesian Optimization) | 一种用于优化昂贵黑箱函数的高效全局优化策略,常用于自动化实验设计中,通过已测量数据来决策下一个最有价值的实验参数。 |
| 强化学习 (RL, Reinforcement Learning) | 一种机器学习方法,智能体(agent)通过与环境交互并接收奖励/惩罚信号来学习最佳行动策略,Max 认为用它来训练一个能操控整个科研平台的智能体是可行的。 |
| LLM (大语言模型) | 如 GPT、Claude 等的大规模语言模型,Max 正在探索其作为“智能体”来协调整个材料发现平台的能力,但对其实用性持审慎态度。 |
| 归纳偏置 (Inductive Bias) | 指机器学习算法为了“偏好”某些假设而做出的一系列假设。本案例中指将物理对称性、分子组合规则等已知知识硬编码进模型,以提升学习效率。 |