来源: YouTube | John Jumper | Jun 22, 2026 分类: 其他 原文发表: Jun 22, 2026 纪要生成: 2026-06-29
John Jumper 是 AlphaFold 团队的前负责人,因在蛋白质结构预测方面的革命性工作,于 2024 年与 Demis Hassabis 和 David Baker 共同获得诺贝尔化学奖。他在 AlphaFold 3 发布后不久宣布离开 Google DeepMind,加入 Anthropic。本集节目录制于他宣布离职前,他深入探讨了 AlphaFold 的技术细节、设计哲学、局限性,以及对 AI 在科学发现中角色的深刻思考。节目中同时穿插了非洲结构生物学家 Emmanuel Nji 的采访,他展示了 AlphaFold 如何让资源有限的科学家也能进行前沿研究。
本节重点
详细精要
AlphaFold 的突破:在 2020 年的 CASP(蛋白质结构预测关键评估) 比赛中,AlphaFold 的预测结果准确性极高,几乎与实验获得的“目标”结构重合,以至于赛事组织方宣布“该问题已基本解决”。
CASP 竞赛与 AlphaFold 的历史性胜利:
对于许多单链目标,AlphaFold 的预测与实验结构如此接近,以至于组织者认为问题已基本解决。
AlphaFold 的巨大影响力和 John Jumper 的新动向:
💬 精华片段(中文)
"We predict nature level science with the press of a button in a very narrow category of nature level science of the structure of a specific protein." (我们按一下按钮就能预测出自然级的科学成果,但仅限于一个非常狭窄的自然级科学范畴,即特定蛋白质的结构。)
本节重点
详细精要
尽管社会投入巨大,在 AlphaFold 诞生前,科学家只通过实验解析了约 140,000 个蛋白质结构,每一个都异常困难。
AlphaFold 加速科学发现的方式:从“斑点学”到原子模型:
胆固醇运输研究案例:一个最近的例子是,科学家研究了一个奇特的蛋白质如何包裹并运输胆固醇,并使用 cryo-EM 和 AlphaFold 结合的方式,终于看清了其完整原子模型,从而理解了突变如何导致高胆固醇和心脏病。
从结构到机制:Midnolin 蛋白的发现故事:
结论:科学家从对一个新蛋白一无所知,到建立了一个精确的、可验证的机制模型,整个过程由 AlphaFold 的预测驱动。
AlphaFold 的根本哲学:精准预测,而非全知全能:
💬 精华片段(中文)
"We are not trying to tell you everything. We are not a model of the entire cell. We are a predictor of this experiment that you did all the time and took you a year." (我们并不是要告诉你关于它的一切。我们不是一个全细胞模型。我们是你花一年时间一直在做的那项实验的预测器。)
本节重点
详细精要
AlphaFold 2 的设计哲学是“让我们构建科学,而不是将图像识别的科学应用于蛋白质”。因为人类的视觉系统并不是解决蛋白质折叠问题所需要的。
AlphaFold 2 的核心架构:Evoformer 与结构模块:
消融实验的真相:
成为高产机器学习者的秘诀:拥抱失败:
💬 精华片段(中文)
"You try it. You measure. 9 times out of 10, you find out you're wrong. Right? If you're wrong 9 times out of 10, you're a very successful machine learner. You're incredibly productive." (你去尝试。去测量。十次里有九次,你会发现你错了。对吧?如果你十次能错九次,那你就是一个非常成功的机器学习者。你的效率太高了。)
本节重点
详细精要
AlphaFold 产生的 2 亿个预测结构,是一个让人类科学家去“理解”的宝库,但它本身并不执行“理解”这个动作。
代码 vs. 数据:谁在干活?
我们(工程师)的工作是识别出模型想要学习什么算法,然后通过架构设计去加速这个过程。
架构创新的力量:一个反直觉的例子:
通常,删除参数不会让验证集的损失下降。这说明在这个特定问题上,卷积层可能对学习目标特征是有害的。这是一个深刻的、来自实验的局部知识。
对“痛苦教训 (The Bitter Lesson)”的批评:
💬 精华片段(中文)
"I don't really love the bitter lesson as people try and apply it. In fact, AlphaFold 2 is the opposite of that. We did a whole bunch of specialty stuff because our data is not finite." (我并不怎么喜欢人们试图应用‘痛苦教训’的方式。事实上,AlphaFold 2 就是它的反面。我们做了一大堆专门的东西,因为我们的数据不是无限的。)
本节重点
详细精要
这使得研究者可以直接问:“这个药物分子会粘在蛋白质的哪个位置?”
AlphaFold 3 并非传统意义的“扩散模型”:
扩散模块的作用类似于 AlphaFold 2 中的结构模块——一个 “细节求解器” 或 “几何化引擎”,负责将已经很清晰的全局约束细化成精确的 3D 坐标。
两种相反的问题解决路径:
这与生成图像时“先形成彩色斑点,再决定斑点的语义含义”的扩散过程是反直觉的不同的。
高级标签的无用性:
💬 精华片段(中文)
"People like to say, this works because it's a transformer. And this works because it's a transformer doesn't explain why chat models have gotten vastly better in the last 3, 4 years." (人们喜欢说,这能工作是因为它是Transformer。但‘因为它是Transformer’并不能解释为什么聊天模型在过去三四年里变得强大了这么多。)
本节重点
详细精要
这些能力不是因为你“预测下一个token”这件事本身而发展出来,而是因为你把这个预测任务做到了极其好的程度。
如何更便宜地获得智能?从工具使用到网络内在能力:
最大的技术挑战在于,我们还不知道怎么把这个外部工具能力蒸馏 (distill) 回网络本身,让网络不再需要这个外部工具。比如,我们还没能做出一个拥有惊人记忆力、不需要外挂笔记的模型。
AI 在科学发现中的角色类比:
💬 精华片段(中文)
"There's this old joke... He goes to some screw or some nut and turns it a quarter turn. The factory roars back to life... And they say, 'what... $10,000?'. 'Knowing what to turn.'" (有这么一个老笑话……他走到某个螺丝或螺母前,拧了四分之一圈。整个工厂轰鸣着恢复了生机……他们说:“什么……一万美元?”答案是:“知道拧哪里。”)
本节重点
详细精要
个人经历对比:他曾花接近 4 到 5 年 时间尝试解析一个蛋白质结构,但未成功。有了 AlphaFold 后,他只做了一次蛋白质纯化,收集了数据,然后结合 AlphaFold,在不到 2 到 3 个月 内就得到了结构。
能力建设(Capacity Building)的规模化:
💬 精华片段(中文)
"I tried several years, close to 4, 5 years, and it wasn't successful. With AlphaFold... I got the structure in less than 2, 3 months." (我试了好几年,快四五年了,都没成功。有了 AlphaFold……我不到两三个月就得到了结构。)
| 术语 | 解释 |
|---|---|
| AlphaFold | DeepMind 开发的基于深度学习的蛋白质结构预测系统,能从氨基酸序列高精度预测蛋白质三维结构。 |
| 蛋白质 (Protein) | 由氨基酸长链组成的纳米级生物分子,折叠成特定三维形状以执行生命功能。 |
| 氨基酸 (Amino acids) | 蛋白质的基本组成单元,共有 20 种标准类型,如同字母表中的字母。 |
| CASP (Critical Assessment of protein Structure Prediction) | 蛋白质结构预测关键评估,一个两年一度的科学竞赛,用于客观测试预测方法的进展。 |
| 冷冻电镜 (cryo-EM) | 一种实验技术,通过将蛋白质冷冻后用电镜拍摄其结构,早期常得到模糊的"斑点"图像。 |
| 同步加速器 (Synchrotron) | 一种巨大的粒子加速器,能产生极其明亮的 X 射线,传统上用于解析蛋白质晶体结构。 |
| PDB (Protein Data Bank) | 蛋白质数据银行,一个全球公开的生物大分子三维结构数据库。 |
| Evoformer | AlphaFold 2 的核心网络架构,基于轴向注意力机制,负责融合进化与几何信息,是主计算干线。 |
| 轴向注意力 (Axial Attention) | Evoformer 中使用的一种注意力机制,分别按行和列处理二维矩阵,降低计算复杂度。 |
| 结构模块 (Structure Module) | AlphaFold 2 中将成对距离预测转换为具体三维坐标的"几何化引擎"。 |
| IPA (Invariant Point Attention) | 不变点注意力,一种在局部参考系中操作点并将距离信息用于偏差注意力的机制。 |
| FAPE (Frame Aligned Point Error) | 帧对齐点误差,一种关键的损失函数,在每个残基局部参考系下计算全局位置误差。 |
| SE(3) | 三维空间的特殊欧几里得群,涵盖所有旋转和平移操作,保持物体形状和距离不变。 |
| 等变性 (Equivariance) | 一种数学属性,指输入发生旋转或平移时,输出也对应发生同等的旋转或平移。 |
| 消融实验 (Ablation) | 通过移除或修改模型的某一部分来测试其对整体性能贡献的系统性方法。 |
| 扩散模型 (Diffusion Model) | 一种生成式模型,通过逐步向数据添加噪声直至变成纯噪声,再学习反向去噪过程来生成新数据。 |
| Midnolin | 一个此前未被充分研究的人类蛋白,AlphaFold 揭示了其在细胞蛋白质回收机制中的"夹子"功能。 |
| 表征 (Representation) | 模型内部对数据(如文本、蛋白质)的编码方式,良好的表征能捕捉到有用的概念和结构。 |
| 痛苦教训 (The Bitter Lesson) | Richard Sutton 提出的观点,认为靠算力增长的通用方法总是最终超越基于人类知识的特定方法。 |
| 蒸馏 (Distill) | 将一个大模型或一个复杂系统(如带有外部工具的语言模型)的能力迁移到一个小模型或纯网络中的过程。 |