▶ 原文链接

一位诺贝尔奖得主的离开:John Jumper 与 AlphaFold 的故事

来源: YouTube | John Jumper | Jun 22, 2026 分类: 其他 原文发表: Jun 22, 2026 纪要生成: 2026-06-29


全集重点


嘉宾/话题简介

John JumperAlphaFold 团队的前负责人,因在蛋白质结构预测方面的革命性工作,于 2024 年与 Demis HassabisDavid Baker 共同获得诺贝尔化学奖。他在 AlphaFold 3 发布后不久宣布离开 Google DeepMind,加入 Anthropic。本集节目录制于他宣布离职前,他深入探讨了 AlphaFold 的技术细节、设计哲学、局限性,以及对 AI 在科学发现中角色的深刻思考。节目中同时穿插了非洲结构生物学家 Emmanuel Nji 的采访,他展示了 AlphaFold 如何让资源有限的科学家也能进行前沿研究。


分节详述

00:00 引言:从诺贝尔奖到离开 DeepMind

本节重点

详细精要

💬 精华片段(中文)

"We predict nature level science with the press of a button in a very narrow category of nature level science of the structure of a specific protein." (我们按一下按钮就能预测出自然级的科学成果,但仅限于一个非常狭窄的自然级科学范畴,即特定蛋白质的结构。)

07:23 John Jumper 深度解析:蛋白质折叠问题与 AlphaFold 的哲学

本节重点

详细精要

💬 精华片段(中文)

"We are not trying to tell you everything. We are not a model of the entire cell. We are a predictor of this experiment that you did all the time and took you a year." (我们并不是要告诉你关于它的一切。我们不是一个全细胞模型。我们是你花一年时间一直在做的那项实验的预测器。)

22:21 深入 AlphaFold 2:架构、对称性与“18个二垒安打”

本节重点

详细精要

💬 精华片段(中文)

"You try it. You measure. 9 times out of 10, you find out you're wrong. Right? If you're wrong 9 times out of 10, you're a very successful machine learner. You're incredibly productive." (你去尝试。去测量。十次里有九次,你会发现你错了。对吧?如果你十次能错九次,那你就是一个非常成功的机器学习者。你的效率太高了。)

33:04 人类理解 vs 机器理解:代码、数据与“痛苦教训”

本节重点

详细精要

💬 精华片段(中文)

"I don't really love the bitter lesson as people try and apply it. In fact, AlphaFold 2 is the opposite of that. We did a whole bunch of specialty stuff because our data is not finite." (我并不怎么喜欢人们试图应用‘痛苦教训’的方式。事实上,AlphaFold 2 就是它的反面。我们做了一大堆专门的东西,因为我们的数据不是无限的。)

41:36 AlphaFold 3:是扩散模型,还是旧瓶新酒?

本节重点

详细精要

💬 精华片段(中文)

"People like to say, this works because it's a transformer. And this works because it's a transformer doesn't explain why chat models have gotten vastly better in the last 3, 4 years." (人们喜欢说,这能工作是因为它是Transformer。但‘因为它是Transformer’并不能解释为什么聊天模型在过去三四年里变得强大了这么多。)

45:19 人工智能的未来:表征、智能与通用性

本节重点

详细精要

💬 精华片段(中文)

"There's this old joke... He goes to some screw or some nut and turns it a quarter turn. The factory roars back to life... And they say, 'what... $10,000?'. 'Knowing what to turn.'" (有这么一个老笑话……他走到某个螺丝或螺母前,拧了四分之一圈。整个工厂轰鸣着恢复了生机……他们说:“什么……一万美元?”答案是:“知道拧哪里。”)

49:37 落地非洲:Emmanuel Nji 与 AlphaFold 的“真实世界”影响

本节重点

详细精要

💬 精华片段(中文)

"I tried several years, close to 4, 5 years, and it wasn't successful. With AlphaFold... I got the structure in less than 2, 3 months." (我试了好几年,快四五年了,都没成功。有了 AlphaFold……我不到两三个月就得到了结构。)


专业术语注释

术语 解释
AlphaFold DeepMind 开发的基于深度学习的蛋白质结构预测系统,能从氨基酸序列高精度预测蛋白质三维结构。
蛋白质 (Protein) 由氨基酸长链组成的纳米级生物分子,折叠成特定三维形状以执行生命功能。
氨基酸 (Amino acids) 蛋白质的基本组成单元,共有 20 种标准类型,如同字母表中的字母。
CASP (Critical Assessment of protein Structure Prediction) 蛋白质结构预测关键评估,一个两年一度的科学竞赛,用于客观测试预测方法的进展。
冷冻电镜 (cryo-EM) 一种实验技术,通过将蛋白质冷冻后用电镜拍摄其结构,早期常得到模糊的"斑点"图像。
同步加速器 (Synchrotron) 一种巨大的粒子加速器,能产生极其明亮的 X 射线,传统上用于解析蛋白质晶体结构。
PDB (Protein Data Bank) 蛋白质数据银行,一个全球公开的生物大分子三维结构数据库。
Evoformer AlphaFold 2 的核心网络架构,基于轴向注意力机制,负责融合进化与几何信息,是主计算干线。
轴向注意力 (Axial Attention) Evoformer 中使用的一种注意力机制,分别按行和列处理二维矩阵,降低计算复杂度。
结构模块 (Structure Module) AlphaFold 2 中将成对距离预测转换为具体三维坐标的"几何化引擎"。
IPA (Invariant Point Attention) 不变点注意力,一种在局部参考系中操作点并将距离信息用于偏差注意力的机制。
FAPE (Frame Aligned Point Error) 帧对齐点误差,一种关键的损失函数,在每个残基局部参考系下计算全局位置误差。
SE(3) 三维空间的特殊欧几里得群,涵盖所有旋转和平移操作,保持物体形状和距离不变。
等变性 (Equivariance) 一种数学属性,指输入发生旋转或平移时,输出也对应发生同等的旋转或平移。
消融实验 (Ablation) 通过移除或修改模型的某一部分来测试其对整体性能贡献的系统性方法。
扩散模型 (Diffusion Model) 一种生成式模型,通过逐步向数据添加噪声直至变成纯噪声,再学习反向去噪过程来生成新数据。
Midnolin 一个此前未被充分研究的人类蛋白,AlphaFold 揭示了其在细胞蛋白质回收机制中的"夹子"功能。
表征 (Representation) 模型内部对数据(如文本、蛋白质)的编码方式,良好的表征能捕捉到有用的概念和结构。
痛苦教训 (The Bitter Lesson) Richard Sutton 提出的观点,认为靠算力增长的通用方法总是最终超越基于人类知识的特定方法。
蒸馏 (Distill) 将一个大模型或一个复杂系统(如带有外部工具的语言模型)的能力迁移到一个小模型或纯网络中的过程。

延伸思考

  1. Anthropic 的动机:John Jumper 带着构建高度专业化、结构化 AI 系统的经验加入 Anthropic,这是否意味着 Anthropic 正在计划从构建通用安全大模型,转向构建针对特定科学或安全领域的“AI 科学家”?AlphaFold 的设计哲学(谦逊、严格以实验为基准)会如何影响 AI 安全研究的范式?
  2. AI for Science 的未来范式:John 多次强调 AlphaFold 的成功来自“18个二垒安打”而非一个全垒打,且与“痛苦教训”背道而驰。这是否意味着下一个重大的科学 AI 应用,必须由像他一样既是顶尖领域科学家又是顶尖 ML 工程师的团队,通过大量的定制化工程和领域知识来构建,而非等待一个通用的“科学基础模型”自动解决一切?
  3. “理解”的断层:模型实现了前所未有的“预测”和“控制”,但“理解”仍然是人类的专属。在这个 AI 加速发现的时代,科学教育应该如何改革?我们是否应该培训更多像 Emmanuel Nji 一样的人,让他们不仅成为 AI 工具的使用者,更成为能够通过 AI 预测结果来提炼新机制、新理论的“AI 注释者”?
  4. 工具能力的蒸馏难题:John 提出了当前 AI 的一个关键瓶颈:我们善于通过外部工具(代码框架)来弥补网络的内在缺陷(如记忆),但无法将这些能力蒸馏回网络本身。解决这个难题,是否是通向更通用、更自主智能体的关键一步?AlphaFold 不需要外部工具,其“迭代精炼”是内化于网络的,这能不能为其他领域提供启发?

原文发表:Jun 22, 2026  ·  纪要生成:2026-06-29