▶ 原文链接

AI 驱动材料发现:从物理世界到创业前线 | AI4Science 社区早餐会

来源: YouTube | Max Welling | Oct 22, 2025 分类: 其他 原文发表: Oct 22, 2025 纪要生成: 2026-06-25


全集重点


嘉宾/话题简介

Max WellingCUSP AI 的联合创始人兼 CTO,一位理论物理学家出身的机器学习先驱。他的职业生涯始于量子引力研究,后转向机器学习领域,曾在加州、加拿大和英国的学术界任职,并先后在高通(Qualcomm)和微软研究院(Microsoft Research)领导 AI for Science 相关研究。约 19 个月前,他正式创立 CUSP AI,专注于利用 AI 平台发现和设计新材料,特别是应用于碳捕获、电池等可持续发展领域。本集节目是 AI4Science 社区早餐会的现场对话,Max 深入分享了他从学术研究到创业的转变、CUSP 的技术平台细节、AI 在物理世界落地的挑战,以及对欧洲深科技创业环境的深刻洞察。


分节详述

[00:00] 开场与 Max Welling 的职业轨迹

本节重点

详细精要

💬 精华片段(中文)

“我在加州、加拿大和英国的机器学习系任职过……2013年我回到荷兰……创业的冲动太强烈了,必须去挠一挠,所以大约19个月前,我们正式创立了CUSP AI。” “I've been m in the machine learning faculty basically in California and Canada and U and UK... and so about uh I would say one now at 19 months ago now we officially um founded caspai which is AF for science but more precisely AF for materials.”

[03:06] 核心转折:从数字空间到物理世界的“灵光一现”

本节重点

详细精要

💬 精华片段(中文)

“我当时想,这太美了,因为这实际上是一个对称性近乎完美的真实案例……它连接回了我的根源,即理论物理。” “I thought, okay, that's beautiful because this is an actual example where the symmetry is almost perfect... that connected back to my roots which was theoretical physics.”

[06:16] CUSP AI 平台技术架构解密

本节重点

详细精要

💬 精华片段(中文)

“你可以在某种程度上将其视为一个搜索引擎,你在查询框中输入你感兴趣的材料类型和属性……然后后台会有一个智能体协调搜索和计算。” “you can think of it as a search engine where you literally type like the type of material and the properties of that material that you're interested in in some kind of query box... there is an agent that will coordinate the search and the computations.”

[11:28] AI for Science 的宏大机遇与根本挑战

本节重点

详细精要

💬 精华片段(中文)

“化学家们习惯于只发表成功的实验和计算……我们应该养成保存一切的习惯,这对机器学习来说真的非常有用。” “chemists have the habit of only uh sort of publishing the successful um kind of experiments and computations and we should get into the habit of actually saving everything which for machine learning is really very useful.”

[14:11] 问答环节:数据、3D 几何与物理有效性

本节重点

详细精要

💬 精华片段(中文)

“如果晃动它们一下,很多都会坍塌……你可以用电脑来模拟这个,这非常有意思。所以我们建了一个工具,叫‘floppy MOF detector’。” “if you shake them a little bit, many of them collapse... we actually built a tool which is called floppy moth. And the floppy moth detector basically took a moth and it would shake it a little bit and then would say would it collapse? Yes or no?”

[21:34] 被忽视的研究领域、论文推荐与 LLM 的边界

本节重点

详细精要

💬 精华片段(中文)

“我无法想象一个仅仅在通用数据上训练出的LLM,能聪明到将这些工具串联起来……然后变得比一个贝叶斯优化器更聪明。我无法想象,但我们在构建它们,我很乐意被惊喜。” “I cannot imagine that's the case but we are building them and um I'm I'm super happy to be pleasantly surprised.”

[30:00] 从实验室到市场:创业的最大障碍

本节重点

详细精要

💬 精华片段(中文)

“我们到底为什么没有一套针对初创公司的统一法律体系?……一个在其他国家的初创公司,为了在德国做生意,得先在这里建一个公司,这有点太过了。” “Why is there not one set of laws for startups for instance right... for a startup in another country to build a company here first in in order to do business in in in in Germany is like it's like too much.”

[35:15] 职业建议、成功叙事与企业文化

本节重点

详细精要

💬 精华片段(中文)

“我常说,这不是关于失败,而是关于你多快能从失败中恢复过来……失败是一个非常独特的学习之地,因为你有了一个非常好的负面数据点。” “it's not about failing, it's about how quickly can you recover from failing... failing is a unique place where you can learn um a lot at that point because you have a very good negative data point.”

[48:51] 深度技术讨论:AI 模型在科学中的泛化与验证

本节重点

详细精要

💬 精华片段(中文)

“你离已知区域越远,就越可能破坏物理规律……所以它就像一个生成-验证-再训练的工作流,一步步地向你感兴趣的材料逼近。” “the further you go away the more likely you break physics and so the harder it gets... you keep verifying... retrain your generative models in this area and so you sort work your way towards the material that you're interested in.”

[53:03] 现状、成功定义与闭幕

本节重点

详细精要


专业术语注释

术语 解释
AI for Science 指利用人工智能技术,特别是机器学习,来解决基础科学领域(如物理、化学、生物)研究问题的新兴交叉学科。
等变神经网络 (Equivariant Neural Networks) 一种能够将输入数据(如分子)的对称性变换(如旋转、平移)直接反映在其输出(如预测力场)上的神经网络结构,减少了模型需要学习的复杂度。
机器学习力场 (Machine Learning Force Fields) 利用机器学习模型来高精度且快速地预测原子间作用力和体系能量,以替代计算昂贵的传统量子力学方法(如 DFT),用于分子动力学模拟。
DFT (密度泛函理论) 一种用于研究多电子体系电子结构的量子力学计算方法,是计算材料科学和化学领域的标准工具,但计算成本高。
金属有机框架 (MOFs, Metal-Organic Frameworks) 一类由金属离子与有机配体自组装形成的多孔晶体材料,在气体存储、分离和催化等方面具有巨大应用潜力,是本案例中讨论的核心材料之一。
Floppy MOF Detector CUSP 团队开发的一个内部工具,通过模拟晃动来快速检测生成的 MOF 结构是否稳定,是否会坍塌。
主动学习 (Active Learning) 一种机器学习范式,模型能够主动选择最“有用”的下一个数据点来请求标签(或计算),从而用更少的数据达到更好的性能,在此用于高效生成计算数据。
MD (分子动力学) 一种计算机模拟方法,通过数值求解牛顿运动方程来研究原子和分子在特定条件下的物理运动和相互作用。
MC / 蒙特卡洛模拟 一种基于随机采样的计算方法,常用于模拟分子在不同位点的吸附、扩散等过程,在计算材料吸附属性(如 CO2 吸附能)时常用。
贝叶斯优化 (Bayesian Optimization) 一种用于优化昂贵黑箱函数的高效全局优化策略,常用于自动化实验设计中,通过已测量数据来决策下一个最有价值的实验参数。
强化学习 (RL, Reinforcement Learning) 一种机器学习方法,智能体(agent)通过与环境交互并接收奖励/惩罚信号来学习最佳行动策略,Max 认为用它来训练一个能操控整个科研平台的智能体是可行的。
LLM (大语言模型) 如 GPT、Claude 等的大规模语言模型,Max 正在探索其作为“智能体”来协调整个材料发现平台的能力,但对其实用性持审慎态度。
归纳偏置 (Inductive Bias) 指机器学习算法为了“偏好”某些假设而做出的一系列假设。本案例中指将物理对称性、分子组合规则等已知知识硬编码进模型,以提升学习效率。

延伸思考

  1. 数据稀缺的商业模式:如果数据是 AI for Science 最大的护城河,是否会催生出专门从事高价值科学数据生成、清洗和交易的“科学数据商”?像 Nomad 这样的公共数据库未来如何在与企业专有数据的竞争中保持其价值和盈利模式?
  2. LLM 作为科学家的终极形态:Max Welling 对 LLM 的怀疑是深刻的。一个折中的路径是,未来顶尖的 AI 科学系统可能是由经过精细微调的 LLM 作为“大脑”,与一个由强化学习训练的、动作极快的“小脑”协同工作,两者的交互边界在哪里?
  3. 合成之殇与工艺的价值:既然合成性是最大瓶颈,那么在 AI 材料发现赛道中,率先布局 自驱动实验室高通量实验 的企业是否能获得绝对优势?这可能会将竞争从纯粹的算法硅基竞赛,重新拉回到需要深厚物理积累的湿实验和工艺工程上。
  4. 欧洲的“失去的十年”:Max 指出的欧洲初创企业规模化困境,是否会使欧洲在未来十到二十年的深科技供应链中,再次沦为“创新的摇篮,产业的墓场”?资金和市场的一体化何时能跟上人才和政策的步伐?
  5. 创造力是组合还是涌现:Max 将发现新材料的创造力定义为“以令人惊讶的方式组合现有模块”,这与当前扩散模型(Diffusion Model)或生成式模型的运作原理非常契合。但这是否意味着 AI 永远只能做“混合者”而非“发明家”?一种从未在数据和理论上出现的“涌现”式全新材料结构,能否通过 AI 产生?

原文发表:Oct 22, 2025  ·  纪要生成:2026-06-25