一位诺贝尔奖得主的离开：John Jumper 与 AlphaFold 的故事

来源： YouTube | John Jumper | Jun 22, 2026 分类： 其他 原文发表： Jun 22, 2026 纪要生成： 2026-06-29

全集重点

AlphaFold 不是生命模型，而是实验预测机器：它预测的只是一类特定的实验结果，并非生命全貌，这种谦逊与精确是其成功的关键。
AI for Science 的核心不是通用架构，而是深度领域知识：AlphaFold 2 的成功来自 18 个中等创新的叠加，而非单一的“对称性”或“Transformer”魔法。
人类理解与机器学习的代码/数据张力：我们编程的是算法，但机器学习学到的是数据中的规律。好的架构设计是加速模型学习它本来就该学会的东西。
对“痛苦教训”的反驳：AlphaFold 2 恰恰证明了在数据有限时，必须针对特定问题设计专门的架构和归纳偏置。
从预测到控制再到理解：AI 能够实现精确预测和控制，但“理解”仍需要人类对机器输出的结果进行提炼和实验。

嘉宾/话题简介

John Jumper 是 AlphaFold 团队的前负责人，因在蛋白质结构预测方面的革命性工作，于 2024 年与 Demis Hassabis 和 David Baker 共同获得诺贝尔化学奖。他在 AlphaFold 3 发布后不久宣布离开 Google DeepMind，加入 Anthropic。本集节目录制于他宣布离职前，他深入探讨了 AlphaFold 的技术细节、设计哲学、局限性，以及对 AI 在科学发现中角色的深刻思考。节目中同时穿插了非洲结构生物学家 Emmanuel Nji 的采访，他展示了 AlphaFold 如何让资源有限的科学家也能进行前沿研究。

分节详述

00:00 引言：从诺贝尔奖到离开 DeepMind

本节重点

John Jumper 带领团队解决了长达 50 年的蛋白质折叠难题，并因此获得诺贝尔化学奖。
他在获奖后突然宣布离开 DeepMind，加入 Anthropic，这一举动引人注目。
AlphaFold 并非通用基础模型，而是一个为解决特定科学问题而高度工程化的系统。

详细精要

AlphaFold 解决了半个世纪的科学瓶颈：
蛋白质是生命的纳米机器：DNA 是生命蓝图，指导合成由 20 种氨基酸组成的长链蛋白质。这些蛋白质自行折叠成特定的三维形状，其形状决定了其功能（结合什么、催化什么化学反应等）。
实验难度极高：理解一个蛋白质的结构曾是一个博士级别的课题，可能需要花费一年时间和约 10 万美元 才能得到一张“照片”。科学家需要使用同步加速器（一种小镇大小的巨型机器）进行 X 射线晶体学实验，这个过程往往需要数年的尝试。
AlphaFold 的突破：在 2020 年的 CASP（蛋白质结构预测关键评估） 比赛中，AlphaFold 的预测结果准确性极高，几乎与实验获得的“目标”结构重合，以至于赛事组织方宣布“该问题已基本解决”。
CASP 竞赛与 AlphaFold 的历史性胜利：
每两年举办一次的 CASP 竞赛是蛋白质结构预测领域的奥林匹克。全球团队竞相预测尚未公开发表的实验结构。
几十年来，进展缓慢而渐进，直到 AlphaFold 在 2020 年取得了显著优于竞争对手的成绩。
对于许多单链目标，AlphaFold 的预测与实验结构如此接近，以至于组织者认为问题已基本解决。
AlphaFold 的巨大影响力和 John Jumper 的新动向：
开源数据库：DeepMind 没有将其私有化，而是公开了一个包含超过 2 亿个 预测蛋白质结构的数据库。
广泛应用：如今已有超过 300 万 研究人员在 190 多个国家 使用 AlphaFold 数据库。
诺贝尔奖的认可：2024 年诺贝尔化学奖的一半授予 Demis Hassabis 和 John Jumper，另一半授予计算蛋白质设计领域的 David Baker，标志着 AI 成为化学家前所未有的新工具。
加入 Anthropic：就在几天前，John Jumper 宣布离开 Google，加入 Anthropic。他的研究背景（高度结构化、专门设计的预测系统）与 Anthropic 追求的方向（可能涉及更复杂的科学推理或安全研究）的结合引人深思。

💬 精华片段（中文）

"We predict nature level science with the press of a button in a very narrow category of nature level science of the structure of a specific protein." (我们按一下按钮就能预测出自然级的科学成果，但仅限于一个非常狭窄的自然级科学范畴，即特定蛋白质的结构。)

07:23 John Jumper 深度解析：蛋白质折叠问题与 AlphaFold 的哲学

本节重点

蛋白质从线性氨基酸链自发折叠成复杂三维结构（如自组装的宜家书架）。
AlphaFold 作为“起始点”，如何帮助科学家将模糊的实验数据（如冷冻电镜的“斑点”）精炼为原子级模型。
通过 Midnolin 蛋白的发现案例，阐述 AlphaFold 如何帮助科学家从一无所知到建立完整的机制理解。
AlphaFold 的谦逊：它只预测一项特定实验的结果，而不是对整个细胞进行建模。

详细精要

蛋白质：生命的执行单元：
人类的 20,000 种蛋白质执行了细胞几乎所有的功能，从运动到催化。
理解蛋白质结构对于将基因突变（如帕金森病相关突变）与疾病机制联系起来至关重要。
尽管社会投入巨大，在 AlphaFold 诞生前，科学家只通过实验解析了约 140,000 个蛋白质结构，每一个都异常困难。
AlphaFold 加速科学发现的方式：从“斑点学”到原子模型：
起点而非终点：John 将 AlphaFold 视为生物学研究的 起点 (starting point)。它为科学家提供了一个可检验的假设。
与实验结合：一个常见的用法是结合 冷冻电子显微镜 (cryo-EM)。过去，cryo-EM 图像时常模糊到被戏称为“斑点学 (blobology)”。科学家现在会将 AlphaFold 预测的高精度结构套入 cryo-EM 得到的模糊“斑点”中，一旦匹配，就能同时确认结构并获得原子层面的细节。
胆固醇运输研究案例：一个最近的例子是，科学家研究了一个奇特的蛋白质如何包裹并运输胆固醇，并使用 cryo-EM 和 AlphaFold 结合的方式，终于看清了其完整原子模型，从而理解了突变如何导致高胆固醇和心脏病。
从结构到机制：Midnolin 蛋白的发现故事：
起点：研究人员发现一个名为 Midnolin 的人类蛋白在细胞回收机制中至关重要，但对其几乎一无所知，只知道它不按常规方式工作。
AlphaFold 的应用：他们让 AlphaFold 预测 Midnolin 与近 500 种受其影响的蛋白的相互作用。在大约 40% 的案例中，AlphaFold 预测出一个非常特异的模式：目标蛋白的一部分像被夹子一样“卡”在 Midnolin 的两个部分之间。
实验验证：科学家根据 AlphaFold 的预测，精确地切除了目标蛋白上被“夹住”的片段。在 10 个测试案例中，9 个 完全按 AlphaFold 预测的方式失效（蛋白无法被回收）。第 10 个案例中，效果部分降低，科学家再次检查 AlphaFold 预测，发现 AlphaFold 认为该蛋白有两个“被夹”部位，当他们将两个部位都切除后，降解过程被彻底阻断。
结论：科学家从对一个新蛋白一无所知，到建立了一个精确的、可验证的机制模型，整个过程由 AlphaFold 的预测驱动。
AlphaFold 的根本哲学：精准预测，而非全知全能：
与其说 AlphaFold 试图解释一切，不如说它是一台 “实验预测机器”。它的目标是预测一个科学家花一年时间才能完成的特定实验（结构解析）的结果。
这种 谦逊 (humility) 是其力量的来源：因为它只预测一个可被精确验证的东西，所以它的预测才足够可靠，能够成为进一步研究和推理的基础。
它不是对整个细胞或者生命过程的模拟。John 认为，如果要建立通用的生物学模型，它很可能看起来更像是语言模型，而不是 AlphaFold 这种更“狭窄”的预测器。

💬 精华片段（中文）

"We are not trying to tell you everything. We are not a model of the entire cell. We are a predictor of this experiment that you did all the time and took you a year." (我们并不是要告诉你关于它的一切。我们不是一个全细胞模型。我们是你花一年时间一直在做的那项实验的预测器。)

22:21 深入 AlphaFold 2：架构、对称性与“18个二垒安打”

本节重点

John 反对将 AlphaFold 2 的成功归因于单一因素（如 SE(3) 等变性），强调它是无数工程细节的叠加。
Evoformer 作为核心计算干线，承担了 90% 以上的计算量和精度贡献。
等变性（Equivariance）的贡献被高估，只占 30 分提升中的 2 分。
通过“消融实验”（Ablations）来理解模型的负载部分，指导 AlphaFold 3 的架构简化。

详细精要

驳斥“AlphaFold 2 只是 CNN”的观点：
AlphaFold 1 的机器学习核心确实是一个现成的 CNN（取自计算机视觉），但它的前后包裹了大量蛋白质特异性组件。
AlphaFold 2 的设计哲学是“让我们构建科学，而不是将图像识别的科学应用于蛋白质”。因为人类的视觉系统并不是解决蛋白质折叠问题所需要的。
AlphaFold 2 的核心架构：Evoformer 与结构模块：
输入：有两大信息源：（1）目标蛋白质的序列；（2）所有进化上相关的蛋白质的序列。蛋白质结构在进化中变化非常缓慢，这些序列提供了宝贵的进化耦合信息。
Evoformer 网络：这是 AlphaFold 2 的“巨型主干”，使用了 轴向注意力 (Axial Attention) 机制。它内部有两套相互交流的“线索”：一个代表关于进化的信息，另一个代表关于几何的信息。这个网络占了 90% 以上 的计算量和精度。
结构模块 (Structure Module)：Evoformer 输出的是一个 N×N 的成对距离预测矩阵。结构模块的作用就像一台 “几何化引擎”，它将这些二维的、有时会自相矛盾的约束条件，调和成一个自洽的三维坐标。
IPA 与 FAPE 的真实作用：
- 不变点注意力 (IPA, Invariant Point Attention)：用局部参考系来表示残基，并在这些参考系中进行操作，这是 John 早期的想法。它很酷，但并非颠覆性因素。
- 帧对齐点误差 (FAPE, Frame Aligned Point Error)：这个损失函数被认为是关键的早期突破之一。它在每个残基的局部参考系中计算其他所有残基的位置，然后对 N² 个误差取平均。
消融实验的真相：
- AlphaFold 2 比 AlphaFold 1 提高了约 30 个点（GDT 打分）。
- 当通过消融实验移除等变性/等变性结构时，性能只下降了 2 到 2.5 个点。
- John 以为这篇消融实验的论文会让关于等变性的过度崇拜“告一段落”，但并没有。社区仍然广泛谈论 AlphaFold 2 是等变性的胜利，而很少有人提起 FAPE。
- 一位审稿人的评论非常精准：“这是一篇包含了 6 或 7 篇论文价值的想法的工作。”
- 用棒球比喻：这不是一两个本垒打，而是 18 个二垒安打 (18 doubles) 的叠加。
成为高产机器学习者的秘诀：拥抱失败：
机器学习的过程是：观察数据，提出假设（例如“等变性很重要”），去尝试，去测量。
10 次里有 9 次，你会发现自己错了。如果你能 10 次错 9 次，那你就是一个非常高效、非常高产的机器学习者。 这个过程帮助你建立对这个领域专有的、局部的直觉和“科学”。

💬 精华片段（中文）

"You try it. You measure. 9 times out of 10, you find out you're wrong. Right? If you're wrong 9 times out of 10, you're a very successful machine learner. You're incredibly productive." (你去尝试。去测量。十次里有九次，你会发现你错了。对吧？如果你十次能错九次，那你就是一个非常成功的机器学习者。你的效率太高了。)

33:04 人类理解 vs 机器理解：代码、数据与“痛苦教训”

本节重点

区分“预测、控制、理解”三个概念，AI 目前擅长前两者，而理解是人类的职责。
“你编程的算法”与“你得到的算法”（数据训练出的权重的算法）之间存在张力。
用一个反直觉的现象——删除参数反而提升性能——说明诱导偏置的重要性。
明确反对“痛苦教训”，认为在数据有限时，专业架构至关重要。

详细精要

预测、控制、理解（Predict, Control, Understand）的三角关系：
预测 (Predict)：说出未来会发生什么，某个数值会是多少。这是 AI 擅长的。
控制 (Control)：让未来的某个测量值精确地变成你想要的样子。AI 也能做到。
理解 (Understand)：用极少数的人类可交流、可写在索引卡上的紧凑事实来进行预测。这是目前 AI 做不到的，是人类的责任。
AlphaFold 产生的 2 亿个预测结构，是一个让人类科学家去“理解”的宝库，但它本身并不执行“理解”这个动作。
代码 vs. 数据：谁在干活？
机器学习的一个核心辩论：多少工作是由我们编写的代码（架构） 完成的？多少工作是由数据最终沉降到权重里的？
AlphaFold 表现出的“逐次几何精炼 (successive geometric refinement)”是一个极其优雅且人类可理解的算法。这个算法不是我们编程硬塞进去的，而是网络从数据中学到的。
我们（工程师）的工作是识别出模型想要学习什么算法，然后通过架构设计去加速这个过程。
架构创新的力量：一个反直觉的例子：
在 AlphaFold 2 早期，其架构混合了轴向注意力和卷积层。
有实验人员做了一件事：仅仅删掉了卷积层，没有增加任何参数。结果是，参数更少的模型反而变得更准确了。
通常，删除参数不会让验证集的损失下降。这说明在这个特定问题上，卷积层可能对学习目标特征是有害的。这是一个深刻的、来自实验的局部知识。
对“痛苦教训 (The Bitter Lesson)”的批评：
Richard Sutton 的“痛苦教训”认为，基于大规模计算和数据的通用方法最终会打败基于人类知识的特定方法。
John 明确表示：“我并不怎么喜欢人们试图应用‘痛苦教训’的方式。事实上，AlphaFold 2 就是痛苦教训的反面。”
理由是我们的数据不是无限的。即使是互联网数据也是有限的。当数据有限时，你必须注入人类知识。不要做架构研究是错误的教训。

💬 精华片段（中文）

"I don't really love the bitter lesson as people try and apply it. In fact, AlphaFold 2 is the opposite of that. We did a whole bunch of specialty stuff because our data is not finite." (我并不怎么喜欢人们试图应用‘痛苦教训’的方式。事实上，AlphaFold 2 就是它的反面。我们做了一大堆专门的东西，因为我们的数据不是无限的。)

41:36 AlphaFold 3：是扩散模型，还是旧瓶新酒？

本节重点

AlphaFold 3 虽然使用了扩散技术，但其工作原理与生成图像的扩散模型截然不同。
AlphaFold 3 的扩散模块更像是一个“几何化引擎”，负责填充细节，而非从头决定全局布局。
AlphaFold 2 从局部到整体（先解决局部细节），而 AlphaFold 3 的扩散过程则从全局到局部（先确定整体方位）。
强调不能将高性能系统仅归因于某个高级概念（“因为它是 Transformer”）。

详细精要

AlphaFold 3 的扩展：蛋白质电影宇宙：
AlphaFold 2 只能预测蛋白质分子。而 AlphaFold 3 扩展到了蛋白质数据银行 (PDB) 中的几乎所有分子类别，包括小分子药物、DNA、RNA 等。
这使得研究者可以直接问：“这个药物分子会粘在蛋白质的哪个位置？”
AlphaFold 3 并非传统意义的“扩散模型”：
John 反对把模型塞进一个大概念盒子里并以此解释其成功（“哦，它从 CNN 换成了扩散模型，所以变强了”）。
在 AlphaFold 3 中，有一个巨大的网络主干（类似 Evoformer），它只运行一次。这个主干很可能才是真正“决定”结构的地方。
扩散模块的作用类似于 AlphaFold 2 中的结构模块——一个 “细节求解器” 或 “几何化引擎”，负责将已经很清晰的全局约束细化成精确的 3D 坐标。
两种相反的问题解决路径：
AlphaFold 2：先解决最容易的 局部结构，然后自底向上地，最后解决最难的 全局结构。
AlphaFold 3 的扩散过程：由于起始状态是完全加噪的坐标，它首先必须解决最难问题——全局组织。比如两个蛋白的复合体，它必须先确定这两个“高斯斑点”在空间中的相对位置和朝向，然后才能在后期去细化局部的原子细节。
这与生成图像时“先形成彩色斑点，再决定斑点的语义含义”的扩散过程是反直觉的不同的。
高级标签的无用性：
“这能工作，因为它是 Transformer；这能工作，因为它是扩散模型”——这些说法是有害的简化。
光是这一条解释不了为何聊天模型近年来变得如此之强，解释不了所有那些日常的、细致的研发工作。真正重要的是那些远为复杂和具体的细节。

💬 精华片段（中文）

"People like to say, this works because it's a transformer. And this works because it's a transformer doesn't explain why chat models have gotten vastly better in the last 3, 4 years." (人们喜欢说，这能工作是因为它是Transformer。但‘因为它是Transformer’并不能解释为什么聊天模型在过去三四年里变得强大了这么多。)

45:19 人工智能的未来：表征、智能与通用性

本节重点

对“显式表征”的信仰已经减弱，更强大的表征是模型为了做好预测任务自然发生的。
语言模型的行为克隆与 AlphaFold 的混合架构代表了两种不同的进路。
当前最大的挑战之一是如何更便宜地获得好的表征和概念，以及如何将外部工具中的能力蒸馏回网络本身。
John 认为“智能”可能并非需要显式编程的结构，而是极度优化预测目标后涌现的副产品。

详细精要

表征学习的观念转变：
五年前，人们普遍认为需要在代码中显式地设计一个“高层概念构建器”模块，或者通过损失函数强制学习出解耦表征 (disentangled representations)。
现在的经验表明，模型仅仅是为了不懈地、卓越地预测下一个 token，就自然而然地发展出了这些概念和表征空间。
这些能力不是因为你“预测下一个token”这件事本身而发展出来，而是因为你把这个预测任务做到了极其好的程度。
如何更便宜地获得智能？从工具使用到网络内在能力：
一个尚未解决的问题：如何将表征和概念“更便宜地”得到？
目前，我们可以通过编程的手段（即软件工程）来实现类似记忆的功能。比如让语言模型为自己写笔记，然后在长轨迹中检索这些笔记来提醒自己。
我们发现了网络的内在缺陷，然后在外部的软件框架 (harness) 中修补这些缺陷（例如通过增加外部记忆）。
最大的技术挑战在于，我们还不知道怎么把这个外部工具能力蒸馏 (distill) 回网络本身，让网络不再需要这个外部工具。比如，我们还没能做出一个拥有惊人记忆力、不需要外挂笔记的模型。
AI 在科学发现中的角色类比：
用修理工厂的笑话类比：工厂里最重要的机器坏了，技师只拧了半个螺丝就修好了它，收费 10,000 美元。老板质疑账单，技师说：“拧螺丝只要 50 美分，知道拧哪颗螺丝值 9999.5 美元。”
在药物研发中，“拧螺丝”好比设计和合成一个分子，“知道拧哪颗螺丝”好比理解细胞这个巨大复杂工厂中，我们到底需要干预哪个机制才能治愈疾病。AlphaFold 正帮助我们学习后者。

💬 精华片段（中文）

"There's this old joke... He goes to some screw or some nut and turns it a quarter turn. The factory roars back to life... And they say, 'what... $10,000?'. 'Knowing what to turn.'" (有这么一个老笑话……他走到某个螺丝或螺母前，拧了四分之一圈。整个工厂轰鸣着恢复了生机……他们说：“什么……一万美元？”答案是：“知道拧哪里。”)

49:37 落地非洲：Emmanuel Nji 与 AlphaFold 的“真实世界”影响

本节重点

在获得实验结构生物学设备极其困难的非洲，AlphaFold 实现了技术民主化。
Emmanuel Nji 的个人经历：从数年无果到数月结出果实。
利用 AlphaFold 进行宏大的能力建设计划：10 年内为非洲培养 1000 名结构生物学家。

详细精要

结构性生物学工具的民主化：
非洲科学家 Emmanuel Nji 分享了他的经历。在 AlphaFold 出现之前，解一个蛋白质结构是极其艰难的任务，这往往需要昂贵的设备和多年的尝试。
AlphaFold 的出现让实验计算不再依赖那些在非洲难以获取的昂贵设施。
个人经历对比：他曾花接近 4 到 5 年 时间尝试解析一个蛋白质结构，但未成功。有了 AlphaFold 后，他只做了一次蛋白质纯化，收集了数据，然后结合 AlphaFold，在不到 2 到 3 个月 内就得到了结构。
能力建设（Capacity Building）的规模化：
Nji 的核心工作不仅是自己做研究，更是培训非洲本地科学家如何使用 AlphaFold、如何解读结果、如何利用数据库设计实验。
初期项目一年培训 100 名科学家，并获得 Google DeepMind 和瑞典研究理事会的资助。培训质量不仅没有下降，还有所提升。
宏大目标：计划在未来的 10 年 里，每年培训 100 名科学家，总计为非洲培养接近 1000 名结构生物学实践者。
最终目标是形成一个专注于研究非洲流行疾病（如疟疾、HIV、抗生素耐药性细菌感染）的新兴结构生物学社区。

💬 精华片段（中文）

"I tried several years, close to 4, 5 years, and it wasn't successful. With AlphaFold... I got the structure in less than 2, 3 months." (我试了好几年，快四五年了，都没成功。有了 AlphaFold……我不到两三个月就得到了结构。)

专业术语注释

术语	解释
AlphaFold	DeepMind 开发的基于深度学习的蛋白质结构预测系统，能从氨基酸序列高精度预测蛋白质三维结构。
蛋白质 (Protein)	由氨基酸长链组成的纳米级生物分子，折叠成特定三维形状以执行生命功能。
氨基酸 (Amino acids)	蛋白质的基本组成单元，共有 20 种标准类型，如同字母表中的字母。
CASP (Critical Assessment of protein Structure Prediction)	蛋白质结构预测关键评估，一个两年一度的科学竞赛，用于客观测试预测方法的进展。
冷冻电镜 (cryo-EM)	一种实验技术，通过将蛋白质冷冻后用电镜拍摄其结构，早期常得到模糊的"斑点"图像。
同步加速器 (Synchrotron)	一种巨大的粒子加速器，能产生极其明亮的 X 射线，传统上用于解析蛋白质晶体结构。
PDB (Protein Data Bank)	蛋白质数据银行，一个全球公开的生物大分子三维结构数据库。
Evoformer	AlphaFold 2 的核心网络架构，基于轴向注意力机制，负责融合进化与几何信息，是主计算干线。
轴向注意力 (Axial Attention)	Evoformer 中使用的一种注意力机制，分别按行和列处理二维矩阵，降低计算复杂度。
结构模块 (Structure Module)	AlphaFold 2 中将成对距离预测转换为具体三维坐标的"几何化引擎"。
IPA (Invariant Point Attention)	不变点注意力，一种在局部参考系中操作点并将距离信息用于偏差注意力的机制。
FAPE (Frame Aligned Point Error)	帧对齐点误差，一种关键的损失函数，在每个残基局部参考系下计算全局位置误差。
SE(3)	三维空间的特殊欧几里得群，涵盖所有旋转和平移操作，保持物体形状和距离不变。
等变性 (Equivariance)	一种数学属性，指输入发生旋转或平移时，输出也对应发生同等的旋转或平移。
消融实验 (Ablation)	通过移除或修改模型的某一部分来测试其对整体性能贡献的系统性方法。
扩散模型 (Diffusion Model)	一种生成式模型，通过逐步向数据添加噪声直至变成纯噪声，再学习反向去噪过程来生成新数据。
Midnolin	一个此前未被充分研究的人类蛋白，AlphaFold 揭示了其在细胞蛋白质回收机制中的"夹子"功能。
表征 (Representation)	模型内部对数据（如文本、蛋白质）的编码方式，良好的表征能捕捉到有用的概念和结构。
痛苦教训 (The Bitter Lesson)	Richard Sutton 提出的观点，认为靠算力增长的通用方法总是最终超越基于人类知识的特定方法。
蒸馏 (Distill)	将一个大模型或一个复杂系统（如带有外部工具的语言模型）的能力迁移到一个小模型或纯网络中的过程。

延伸思考

Anthropic 的动机：John Jumper 带着构建高度专业化、结构化 AI 系统的经验加入 Anthropic，这是否意味着 Anthropic 正在计划从构建通用安全大模型，转向构建针对特定科学或安全领域的“AI 科学家”？AlphaFold 的设计哲学（谦逊、严格以实验为基准）会如何影响 AI 安全研究的范式？
AI for Science 的未来范式：John 多次强调 AlphaFold 的成功来自“18个二垒安打”而非一个全垒打，且与“痛苦教训”背道而驰。这是否意味着下一个重大的科学 AI 应用，必须由像他一样既是顶尖领域科学家又是顶尖 ML 工程师的团队，通过大量的定制化工程和领域知识来构建，而非等待一个通用的“科学基础模型”自动解决一切？
“理解”的断层：模型实现了前所未有的“预测”和“控制”，但“理解”仍然是人类的专属。在这个 AI 加速发现的时代，科学教育应该如何改革？我们是否应该培训更多像 Emmanuel Nji 一样的人，让他们不仅成为 AI 工具的使用者，更成为能够通过 AI 预测结果来提炼新机制、新理论的“AI 注释者”？
工具能力的蒸馏难题：John 提出了当前 AI 的一个关键瓶颈：我们善于通过外部工具（代码框架）来弥补网络的内在缺陷（如记忆），但无法将这些能力蒸馏回网络本身。解决这个难题，是否是通向更通用、更自主智能体的关键一步？AlphaFold 不需要外部工具，其“迭代精炼”是内化于网络的，这能不能为其他领域提供启发？

原文发表：Jun 22, 2026 · 纪要生成：2026-06-29