AI 赋能科学突破与生成式 AI 的热力学本质 - 对话 Max Welling

来源： YouTube (The Information Battle Neck) | Max Welling | May 28, 2026 分类： 其他 原文发表： May 28, 2026 纪要生成： 2026-06-25

全集重点

具身智能是通往高级智能的必经之路：Max 认为纯语言模型缺失了与物理世界的交互，而这对于产生自我意识等更高级的智能至关重要，且能解决数据枯竭问题。
科学发现中的“数据可及性”与“验证成本”决定 ML 的适用性：能否应用 ML 取决于能否通过实验或仿真（如 DFT）生成高质量数据，以及验证结果的代价（如高温超导材料的验证成本极高）。
“虚实结合”的主动学习闭环是材料科学的圣杯：关键在于构建从廉价虚拟筛选（ML力场）到昂贵物理实验的优化梯度，利用贝叶斯优化和主动学习平衡探索与利用，解决湿实验的“摩擦力”问题。
硬编码先验知识（世界模型）在数据匮乏时至关重要，但在大数据时代可能会被通用架构取代：Max 支持 Yann LeCun 引入几何与物理常识的观点，但也预测 10 年后，只要数据量足够大，通用的可扩展架构（如 Transformer）会占据主导。
生成式 AI 与随机热力学数学同构：扩散模型的加噪/去噪过程与热力学中的能量消耗、变分自由能（ELBO）与物理自由能具有深刻的数学对偶性，这为 AI 算法创新提供了新源泉。

嘉宾/话题简介

Max Welling 是阿姆斯特丹大学机器学习教授、CuspAI 的联合创始人兼 CTO。他曾在 Qualcomm 担任 VP，并任职于 Microsoft。作为图神经网络、等变模型和贝叶斯深度学习领域的先驱，Max 拥有理论物理博士学位背景。本期播客探讨了从基础模型 scaling law 的局限性、材料科学与气候变化的物理实践，到他最新著作中揭示的“生成式 AI 热力学”这一深刻洞察。

分节详述

00:00 AI 现状与缺失的板块

本节重点

LLM 的能力已接近图灵测试定义的 AGI，但 Max 对纯 Scaling 范式持保留态度。
缺失的核心板块是 具身智能 和 物理世界数据。
人脑的低能耗高效智能表明仍有全新的范式待发掘。

详细精要

LLM 的惊人进展与 Scaling 的隐忧：Max 承认从 1998 年训练只有 100 个参数的模型，到如今万亿参数的大模型，进步是惊人的，已经能在智力层面进行有意义的对话。
他指出业界过于依赖可预测的 Scaling 范式，但当前硬件与人脑之间的能效差距高达 6 到 8 个数量级。
Max 认为，与其把数据中心发射到太空，不如先研究人脑是如何产生智能的，这说明还有非常激动人心的新发现在前方，AI 领域远未终结。
具身智能是通往高级智能的必经之路：Max 明确指出，纯语言模型下一个缺失的关键部分是 Embodiment（具身化），也就是目前火热的 Physical AI（物理 AI）。
他认为智能存在一个频谱，自我意识是某一端的表现。目前的大模型可能不具备，但未来的 AI 没有理由不能具备。
要达到某种程度的自我意识，需要让 AI 模拟人类的身体或在真实世界通过机器人进行学习。此外，纯语言数据即将枯竭，机器人平台是收集海量新数据的最佳途径。
AI 与科学的双向奔赴：Max 的个人职业生涯是从理论物理向 AI 引入物理启发，现在局势反转，AI 开始反哺科学。
这一方向包含两条路径：一是通过计算深刻理解科学（如解薛定谔方程）；二是构建高通量实验或自驱动实验室，在真实世界中收集数据并用这些数据再次提升智能。

💬 精华片段（中文）

“我们似乎在接近通用人工智能……但如果你看到效率上的巨大差异，在同样智能水平下，人类和当前硬件的能效有时差了 6 到 8 个数量级。我认为我们还有很多令人兴奋的东西等待发现，或许在我们把数据中心送上太空之前，可以先研究一下人脑是如何创造智能的。”

"We are edging in on artificial general intelligence... But if you see the enormous difference like... between six and eight orders of magnitude difference in terms of efficiency energy efficiency for the same amount of intelligence between humans and current hardware... we could also study the human brain and figure out... how it creates intelligence, which apparently is a very different paradigm than the current hardware."

06:15 机器学习的科学适用性与脱域问题

本节重点

决定 ML 能否在科学领域奏效的首要因素是数据可用性。
DFT 仿真和实验是获取高质量科学数据的双引擎。
天气预测是 ML 成功的典范，速度比数值积分快 4 个数量级。
量子力学中的强纠缠问题（如高温超导）因难以获取和验证数据，仍然是 ML 的硬骨头。

详细精要

数据是 ML 在科学领域的准入门槛：Max 认为，判断 ML 是否适用于某个科学领域，最关键的是数据能否获得。
气象学是典型的成功案例，气象学家积累并存储了 拍字节 (Petabytes) 级别的数据，使得 ML 模型非常成功。
利用这些数据训练的天气预测模型速度比传统的偏微分方程数值积分器快了 10,000 倍 (4个数量级)，在数据分布范围内的预测甚至更准确，但一旦脱域 (Out-of-domain)，问题就会出现。
仿真与实验：科学数据的来源双引擎：科学数据的来源分为两类，只要其中一条路通，ML 就能介入。
实验数据：依赖于人类长期积累的实验结果。
仿真数据：如果物理原理足够简单且理解透彻，可以通过仿真生成数据。但对于深度量子力学问题，由于存在强纠缠（Strong Entanglement），很难寻找到好的近似解。
密度泛函理论 (DFT) 是化学家和材料科学家广泛使用的一种近似方法，通常效果不错，只要投入足够的算力，就能生成合理的大规模数据集来训练 ML 模型。
ML 局限性的本质：代价高昂的长尾验证：Max 指出，像化学或自动驾驶这类存在海量长尾例外情形的领域，很难通过简单的抽象来理解。
人类理解宏观世界（如因果关系），但如果需要知道某个特定分子的基态能量，必须通过消耗算力或金钱进行实际计算。
对于那些只能通过极昂贵计算或实验来获得答案的问题（例如具有强纠缠性质的量子材料、高温超导），ML 的应用面临巨大挑战。

💬 精华片段（中文）

“最核心的是数据可用性……气象学家存储了拍字节级的数据，这使得它成为机器学习的绝佳靶标。现在的天气预测模型比传统的偏微分方程数值积分器快上4个数量级。”

"The most important thing is that the data needs to be available... meteorologists have just stored their data literally petabytes of data available... that makes it a huge successful target... models out there which predict the weather... like four orders of magnitude faster than PDE numerical integrators."

12:02 验证器、强化学习与材料发现的新范式

本节重点

拥有强验证器的领域（如数学、代码），可以通过 RL 不断提升模型表现。
材料发现领域通过生成-验证-反馈的闭环实现了类似的技术跃迁。
模型架构进步（GNN + 等变性）与化学数据集（如 Materials Project）的成熟，共同推动了材料学的可计算化。

详细精要

验证器驱动的强化学习闭环：Max 赞同数学和编程是当前 LLM 进展最快的领域，因为这得益于良好的验证器。
这与材料科学中的逆设计 (Inverse Design) 相似：生成大量候选材料，如果有一个简便的方法验证其属性，就能通过强化学习不断改进生成模型。
在这个闭环中，模型可以近乎自主地生成数据。但如果验证成本极其昂贵（比如验证某种量子材料的属性，无论是通过计算还是实验都既慢又昂贵），模型训练就会变得极其困难。
材料发现的计算化转折点：Max 阐述了材料学在近几年变得“可解”的三大驱动力。
数据集的成熟：像 Materials Project 这样的标准化数据库极大地改善了数据匮乏的局面。
模型偏置的引入：通过图神经网络 (GNN) 结合等变性 (Equivariance) 创建了机器学习力场 (ML Force Fields)，这种基于物理的归纳偏置极大地提升了预测能力。
深层网络的突破：2009 年以来，深度学习训练方法的成熟（深层网络的可预测能力），使得预测分子力和能量成为可能。

💬 精华片段（中文）

“这很明确，因为那样你就能应用强化学习……如果拥有一个简单的方法来验证材料是否符合你所有的需求，你就能改进你的生成模型去创造更好的分子。”

"That's clear because then you can apply reinforcement learning... if you have an easy way to verify whether the material satisfies all the properties that you want, you can then improve your generative models to make better molecules."

16:42 物理世界的“摩擦力”：连接虚拟与湿实验室

本节重点

湿实验室环境与数字世界存在巨大鸿沟，充满了物理层面的“摩擦成本”。
CuspAI 的解决方案是通过智能体 Mirror 连接数字设计与物理实验，构建双向数据流。
实验端正在向高通量/自驱动实验室进化，以突破当前的设计-制造-测试周期瓶颈。

详细精要

物理世界的摩擦与降速：Max 指出，从沙盘模拟走向真实的湿实验室，一切都会急剧放缓。
实验涉及复杂的人与流程：安全规程、物理空间管理、人对 AI 系统的信任缺失（操作员会二次检查 AI 生成的操作指令）。
供应链的延迟令人绝望：购买实验所需的前驱体材料可能要等几个月，订购特殊的新机器可能需要 2 年才能到位。
因此，绝对不能低估操作湿实验室所需的领域专业知识和人力经验，开展需要与资深实验研究者深度合作。
CuspAI 的虚实结合架构：CuspAI 的具体做法是设计了一个闭环的 AI 智能体系统。
智能体 Mirror：这是一个在数字空间工作的工作流，负责生成分子、评估属性和进行设计。
双向数据流：Mirror 不仅输出分子结构，还会设定全套过程参数（如温度、压力、干燥时间），指挥实验。实验运行后，表征仪器的结果数据会回流到模型。
该架构包含两层优化：一是从廉价但粗糙的代理模型到昂贵但高精度的 DFT 仿真再到极其昂贵精确但耗时的物理实验的梯度；二是通过贝叶斯优化来协调这一系列具有不同保真度和时间成本的工具，寻找最优的实验设计。
加速实验端是未来的关键：Max 认为，当前最大的瓶颈在于实验端的反馈太慢。
自驱动实验室的兴起至关重要，它们越来越依赖机器人自动化，可以指数级增加实验反馈的数量。
这一趋势是从根本上打破传统材料发现周期（数月到数年）的关键，能将工业化 R&D 纳入到 ML 能响应的分钟级/秒级闭环中。

💬 精华片段（中文）

“然后你会发现，嘿，我需要买一些前驱体材料，我得去订货，可能要等上几个月才拿到。然后你又发现需要一台新仪器，那可能要等两年才能到货。一切都极大地减缓了。”

"And then you figure out, hey I need to actually buy precursor materials... I have to order them and it takes maybe a few months before you have them and then you figure out I need a new machine and it actually takes two years to get it. So everything slows down tremendously."

23:04 主动学习、基础模型与科学发现的通用抽象层

本节重点

主动学习在 LLM 时代表面沉寂，但其实以类似 RLHF 的形式在科学领域继续发挥着数据蒸馏的关键作用。
科学发现的通用抽象闭环是可复用的：从定义目标 -> 检索数据库 -> 生成新设计 -> 多保真度评估器 -> 贝叶斯优化。
科学基础大模型会赋能整个化学界，但在特定子问题上仍需通过主动学习进行微调，因为底层物理（薛定谔方程）的计算不能靠背答案解决。

详细精要

主动学习的现代角色：当被问及为何主动学习在 LLM 大潮中似乎不那么主流时，Max 认为这是一种误解。
LLM 中基于人类反馈的强化学习 (RLHF) 本质就是一种主动学习的变体：先由 AI 生成内容，然后获取反馈，再用这些反馈指导下一轮生成。
在科学计算中（特别是处理昂贵的 DFT 计算时），必须在浩瀚的结构空间中寻找最有价值的数据点进行“知识蒸馏”，从昂贵的仿真模型（教师）中提炼数据来训练廉价的 ML力场（学生），这一过程天然需要主动学习来筛选数据标签。
通用科学发现闭环的抽象层：Max 认为，尽管每个科学领域看似不同，但核心的逻辑架构是可高度抽象的通用逆设计过程。
步骤 1 (检索)：先扫描已有数据库，寻找是否已有符合目标的成品。
步骤 2 (生成)：若不存在，启动生成模型，根据具有正确属性的样本，学习生成近似符合条件的新候选设计。
步骤 3 (多保真度评估)：建立一个从廉价到昂贵的评估器栈 (Stack of Evaluators)，利用贝叶斯优化来处理不同精度下的搜索，权衡成本与收益，以此决定下一步是花费 1 秒去粗略计算，还是花 1 个月去做真实实验。
基础模型的泛化壁垒：Max 预测，未来会出现一个覆盖化学全领域的母船级基础大模型 (Foundation Model)。
这种模型会将材料的结构、计算出的特征甚至实验数据结果一起嵌入到一个隐空间中，具有相似功能性质的材料将自然聚在一起。
然而，这种“母模型”无法完全理解每一种新材料，因为那属于分布外 (OOD) 的情形。其根源在于，即便我们知道了物理的“语法”（薛定谔方程），每种新材料依然是一个特定的“故事”，需要实际去解方程才能获知其具体的细节（例如基态能量）。
因此，通用模型捕获了粗粒度的规则 (Regularities)，但在细化到每个新材料类时，还是必须进入主动学习闭环，微调出一个属于该类材料的“小模型动物园”。

💬 精华片段（中文）

“你将得到一个化学领域的母舰级基础模型……但当你深入到某个特定的材料类别时，你会发现这些模型并不完全理解它们……你会进入一个主动学习闭环，找出正确的数据点，为这个特定的材料类别微调你的模型。”

"You'll get like a mother ship of all foundation models for all of chemistry... but if you dive into a particular subclass of problems... these models do not completely understand these new materials... you will then have to go through an active learning loop to find the right data points to fine-tune your models for that particular material class."

30:24 量子力学、世界模型与归纳偏置的博弈

本节重点

Max 同意 Yann LeCun 的观点，认为硬编码物理几何与常识（世界模型）对于小数据下的推理至关重要。
在归纳偏置与纯数据学习的博弈中，数据量越大，归纳偏置的价值越被稀释（参考 CNN 与ViT 的趋同）。
但是，优化地形的约束使得硬编码在特定阶段可能反而损害性能，偏置应该像钟摆一样在后期缓慢“注入”。

详细精要

解释量子力学：更深层的理论可能依然缺失：作为理论物理出身的科学家，Max 对量子力学议题非常感兴趣。
他同意量子力学是一门具有很强的计算能力的理论，但缺乏统一且“不荒唐”的一致性解释。
他特别提到，他的前导师（曾因标准模型获诺贝尔奖）正推行一种完全不同的解释。他认为，未来的高级 AI 或许有足够的创造力提出我们从未想到的新解答。
世界模型与几何先验：Max 完全赞同 Yann LeCun 的理念，支持世界模型。
他指出，将已知的先验知识（如三维空间、旋转对称、变化缓慢性）硬编码进模型是理所当然的，因为我们既然已经知道，就不该让模型浪费指数级的数据去“重新发现”这些规律。等变性正是这一逻辑的体现。
在复杂推理中，几何常识至关重要。Max 举例说明人类是通过极其抽象、粗糙的“概念级”内心模拟来预测后果的（比如预测躲在树后吓唬骑车的小孩结果），这绝不是像素级的预测，而是基于常识的强大世界模型。
归纳偏置的数据规模悖论与优化挑战：针对卷积与视觉 Transformer 的对比，Max 给出了极深刻的解读。
数据规模稀释：他也承认，如果拥有无穷多的数据（例如现代的 Meta 级超大视觉数据集），并且使用数据增强，那么使用视觉 Transformer (ViT) 学习出来的效果会趋近于 CNN 的硬编码效果，该阶段显式的先验变得不那么重要。
优化地形：Max 提出了一个独特的“优化地形 (Optimization Surface)”理论。过早地加入极强几何约束（如权重共享的等变性）会使得损失函数的优化地形变得极其崎岖难训。因此他推测，理想路径是先放松约束找到良好初始点，再逐步加入归纳偏置，这是类似模拟退火的“先放后收”。
未来 10 年赌注：如果未来 10 年有足够多的数据，Max 依然看好类似 Transformer 这种与硬件协同演化的通用架构。而在小数据或特定领域，拥有物理偏置的 等变网络 依然是首选。

💬 精华片段（中文）

"如果世界真的是三维的，具备对称性，我旋转头部物理定律不变……那么为什么不把这些原本就知道的先验知识放进去呢？在我看来，这是一个不需要动脑子就能做出的决定。”

"The fact that the world is three-dimensional... has symmetries like if I rotate my head the physics of the world don't change... why would we not put them in because we already know these things... to me seems like a no-brainer."

43:23 使命感驱动的 CuspAI：气候危机下的科学解法

本节重点

创业动机源于对气候变化的深切担忧，以及对职业生涯末期寻找正外部性。
当前核心攻坚 Direct Air Capture 移除二氧化碳；远期愿景覆盖全能源转型。
CuspAI 构建的是通用的材料设计抽象平台，虽然顶层应用各有不同，但底层的生成/评估/验证逻辑是共享的。

详细精要

为什么是气候？：Max 坦诚表示，离开 Microsoft 后在规划职业生涯最后 10-15 年时，决定押注在对世界有积极影响的课题上。
Direct Air Capture (直接空气捕获)：这是 CuspAI 最先切入的战场。目前每年排放约 400亿吨 二氧化碳，即使 2050 年碳中和，也得在这个世纪里每年从极稀薄的大气中额外去除 200亿吨 的存量。这一任务的能耗和难度极大，若现在不开发，包袱就完全甩给了子孙后代。
能源转型全景：除了碳捕获，还涉及钙钛矿太阳能光伏（叠加硅层捕捉更多波段光能）、燃料电池、新一代电池，甚至未来的可控核聚变。这些都是既重要又有趣的科学难题。
业务架构：通用平台与专用纵深：CuspAI 并不期望一个模型走天下。
通用抽象层（共享）：分子动力学仿真（MD）的逻辑、多保真度评估栈的逻辑是跨材料通用的。
高保真专用层（垂直）：数字孪生是极具设备特异性的，必须为某种特定反应器或制造过程专门构建。不同的材料类别（吸附剂、电池、钙钛矿）涉及完全不同的物理实验流程和表征手段，这部分必须做深做透。

💬 精华片段（中文）

“在碳中和之后，我们需要面临一个世纪的、每年从大气中移除约200亿吨二氧化碳的任务……如果我们不想把这个难题和成本推给子孙后代，我们现在最好就开始着手解决。”

"After that there is a century of removing carbon dioxide from the atmosphere at about 20 gigatons a year... if we don't want to push that problem and the cost of that problem to the future generations... we'd better work on this now."

56:52 新书推荐：《生成式 AI 与随机热力学》

本节重点

揭示了扩散模型与物理热力学在数学上的惊人一致性。
ELBO 就是物理上的变分自由能；EM 算法里的 E 步对应熵增，M 步对应做功。
底层的哲学共鸣：概率 AI 和 热力学 都是在“丢失了微观自由度信息”后产生的宏观理论。

详细精要

同构的数学：从图像降噪到生命维持：Max 解释了撰写这本书的初衷，灵感始于他在南非的讲座。
扩散过程：一张图片缓慢地分解为乱码噪声，这就是生命从不规律退化的自然熵增过程。
逆扩散/生成：要将噪声“回放”成图像，在物理上需要施加外力做功，在 AI 上需要消耗算力能量的评分函数 (Score Function)。
热力学/生成 AI 公式对照表：
1. 变分自由能 = ELBO：物理学里的变分自由能（决定系统如何弛豫）与 ML 里的证据下界 (ELBO) 在数学形式上完全一致。
2. EM 算法 = 功与热：ML 熟知的期望最大化 (EM) 算法，推断步骤对应物理学的产热/熵增步；学习步骤对应外力做功耗能步。
3. Jarzynski 等式 = 非归一化重要性采样：这是一种从非平衡态做功提取平衡态信息的技术，直接对应 ML 的某种归一化流及其变体。
交叉授粉的未来：Max 认为，既然底层都是随机过程在信息缺失下的处理逻辑，那么热力学发展出来的工具深刻地启发下一代 AI 算法。
这呼应了压缩的本质：在信息瓶颈理论中，AI 通过逐层抛弃不必要的信息（增加噪声，产生热）来提取核心概念。物理学中的重整化群 (Renormalization Group) 就是做一模一样的事——不断将微观像素甚至原子的信息平均掉，从而涌现出“桌子、椅子”等宏观的组织化原理 (Organizing Principles)。

💬 精华片段（中文）

“人们发现这两个领域的数学内容几乎完全相同……我们有变分自由能，在机器学习里我们也有变分自由能，也就是证据下界 (ELBO)。这能实现交叉授粉，这让我着迷。”

"I found that the mathematics between those two are actually almost identical... we clearly have a variational free energy... and in machine learning we also have a variational free energy which is the ELBO evidence lower bound... now you can cross fertilize... I find that fascinating."

01:10:30 ICLR 2026 前瞻与 Max 的寄语

本节重点

大型学术会议变得过于拥挤，而工作坊才是小而精的思想碰撞地。
给新人的建议：关键是线下找到正确的人开启合作，而不仅是看海报。
CuspAI 正在招聘，专注于有使命感的 AI 科研。

详细精要

巨型会议的复兴：重拾 NeruIPS 的初心：Max 将在即于里约热内卢举办的 ICLR 2026 上发表主题演讲。
他指出，现在的 NeruIPS 等会议过于膨胀（可能要走 10 分钟才能穿过海报区找到特定论文），对于新人极其不友好。
回顾历史，早期的神经信息处理系统大会 (NeruIPS) 其实是认知科学、神经科学与 AI 的混合体，那时的跨学科刺激很大。Max 预感下一次范式革命将源自神经科学的新发现（如脑电波传播），或是物理理论的复兴，他呼吁社区不要只沉迷于做增量工程。
他给出的参会建议是，不要试图在海量视频中寻找知识，AI 助手能做到；应当专注在“找人合作”上，合作才是最能激发灵感的乐事。

专业术语注释

术语	解释
AGI	通用人工智能。Max 认为这个概念很模糊，如果按图灵测试标准，现有大模型已经非常接近。
Physical AI / Embodiment	具身智能/物理 AI。指搭载在机器人实体上，能与物理世界交互的智能形态。Max 视其为迈向更高级智能和获取新数据的核心方向。
DFT (Density Functional Theory)	密度泛函理论。材料化学中广泛使用的一种量子力学近似方法，用于计算材料结构能量，是生成仿真数据的“兵工厂”。
ML Force Fields	机器学习力场。利用图神经网络（GNN）和等变性学习的原子间作用力场，比传统的 DFT 计算快得多，是其廉价替代品。
GNN (Graph Neural Networks)	图神经网络。在分子和材料科学中，常用于表示原子及其化学键连接，是 Max 开创的关键技术之一。
Equivariance	等变性。重要的归纳偏置，保证当分子旋转或平移时，模型给出的预测（如力）会对应变化，极大地降低了所需的数据量。
Wet Lab	湿实验室。指需要处理各种化学试剂和物理设备，进行真实实验的实验室，与纯计算机仿真/数字环境相对。
Active Learning	主动学习。模型按某种策略自动筛选出最有标注价值的数据点，打上标签后再利用它们训练，常用于昂贵的数据（实验/仿真）生成场景。
Foundation Model	基础模型。在此语境下指化学/生物领域通用的“母模型”，能够编码任何材料的隐空间特征，但处理极端泛化时仍需微调。
World Models	世界模型。Yann LeCun 推崇的架构，Max 极度认同，指将通过常识（几何、物理）所感知的硬编码先验融入 AI，帮助其理解世界规则并进行推理和规划。
Scaling Laws	规模法则。指通过增加模型参数/数据/算力就能直接无损提升模型能力的法则。Max 认为这虽然在资料科学里也存在，但有天花板。
Direct Air Capture	直接空气捕获。从极稀薄的大气中提取和封存二氧化碳的技术。这是 CuspAI 当前聚焦攻克的气候核心问题。
Stochastic Thermodynamics	随机热力学。研究对象为非平衡态下，包含微小（随机）粒子的物理系统中的能量和信息交换。Max 新书认为它和生成 AI 背后的原理相同。
ELBO	证据下界（物）。生成模型（如 VAE 和扩散模型）的核心优化目标。Max 证明其在物理中直接对应变分自由能。

延伸思考

算力的热力学诅咒：Max 的新书观点极富冲击力——既然生成式 AI 和热力学是同构的，这意味着生成过程中的“智能”必然伴随着实质的“热力学熵增”和能量耗散。这是否为 LLM 的 Scaling Law 设置了一个不可逾越的物理壁垒？
世界模型实操难题：Max 既推崇世界模型，又指出强行注入先验会“弄坏”损失函数的优化地形。我们在工程落地上，如何设计一种机制（譬如课程学习式的极慢退火）才能在保留 Transformer 可扩展性的同时，又完美塞入几何物理常识，从而突破纯黑箱的小样本学习瓶颈？
实验室悖论：AI 智能体指导湿实验室制造材料，是一种完全的“黑盒-白盒”交互。如果 AI 推荐了有毒或危险的中间产物，且人类操作员出于“信任”而跳过安全检查，这种具身化 AI 造成的物理灾难远比生成错别字更致命。我们应该如何为这种带手和脚的 AI 设立“急停”规则？
基础模型的微调陷阱：Max 提到针对具体材料要“微调一个小动物园”。如果万有基础模型拥有 99% 的化学知识，但在微调到新材料时就全忘了（灾难性遗忘），并且要求你陷入耗资数百万的主动学习闭环，直接做专家小模型是否比用基础模型 Fine-Tune 更经济？

原文发表：May 28, 2026 · 纪要生成：2026-06-25