▶ 原文链接

构建通用科学智能:从 Med-PaLM 到 co-scientist 的多智能体科学发现之旅

来源: YouTube | Vivek (Google DeepMind) | May 27, 2026 播客: Stanford Online 分类: 其他 原文发表: May 27, 2026 纪要生成: 2026-06-22


全集重点


嘉宾/话题简介

Vivek 是 Google DeepMind 的研究科学家,领导 AI、科学与医学交叉领域的研究。他是 Med‑PaLMMed‑PaLM 2 的主要研究者(首个通过或达到美国医师执业考试专家级水平的系统),同时联合领导 AMIE 项目(旨在构建医疗超级智能)。此前,他在 Facebook AI Research 研究多模态助理系统,并在哈佛公共卫生学院担任兼职教授。本次讲座系统介绍了该团队从医学问答转向通用科学发现系统的历程,重点阐述 co‑scientist 多智能体系统的设计哲学、架构及多项实验验证。


分节详述

00:00 开场与背景

本节重点

详细精要

💬 精华片段(中文)

项目就像你从悬崖上跳下,并且不得不在坠落的过程中,搞清楚如何造出一台飞行器或一架飞机。

“It's almost like you jumping off a cliff, and you have to figure out building out a flying machine or an airplane on the way down.”


07:23 系统 1 与系统 2 思维:科学发现需要什么

本节重点

详细精要

💬 精华片段(中文)

你与那些最优秀的科学家交谈时,他们会告诉你,最好的想法通常是在他们思考一个问题数周、数月甚至数年之后才出现的。

“When you talk to some of the best scientists, they'll tell you that they've had their best ideas when they've been thinking about a problem for weeks or months, sometimes even like years.”


12:43 通用性与自然语言是关键

本节重点

详细精要

💬 精华片段(中文)

Demis 说,他当时对 Garry Kasparov 的印象比 Deep Blue 更深刻,原因很简单,因为 Kasparov 的大脑极其通用。

“What Demis says is that he was actually more impressed by Garry Kasparov rather than by Deep Blue in that sequence. And the reason for that is just simply that Garry Kasparov's brain was remarkably general.”


17:59 从 AlphaGo 的自对弈到科学自我辩论

本节重点

详细精要

💬 精华片段(中文)

你把算力扔给一个问题,你的算法好到几乎不需要你做别的事,你只需让系统运行一段时间,它就在这个任务上变得超人了。这难道不棒吗?

“Essentially, throw compute at a problem, and your algorithm is just so good that you don't have to do much. You just let that system run for a period of time, and then it becomes superhuman at this task. Isn't that awesome?”


22:13 co‑scientist 的多智能体架构详解

本节重点

详细精要

💬 精华片段(中文)

如果你只是把系统做成一个生成或审查机器,那它只会产出很多很多还不错或者过得去的点子。但在科学发现上,这远远不够。专家科学家缺的不是点子,而是时间和资源。

“If you were to simply have only a generation or a review agent within the system, then I think what that would end up being is a system that's generating many, many like good ideas or decent ideas … But I would argue that that's actually not enough to move the needle in terms of scientific discovery.”


34:08 现场问答(架构与概念相关)

本节重点

详细精要

💬 精华片段(中文)

对于搜索空间极大,并且你可以让问题智能地探索该空间的那类问题,从某种意义上看是几乎没有上限的。

“There's a class of problems where the search space is so big that if you keep on throwing more compute at the problem and let the problem intelligently explore the search space, then it is very likely to come up with better solutions. So for those classes of problems, essentially, there's in some ways no limits.”


39:56 实验验证:多领域突破性成果

本节重点

详细精要

💬 精华片段(中文)

José 不是那种容易激动的人,他是一位经验极为丰富的研究者。当他给出那种本能的反应时,那是我们第一次感到:也许我们真的抓住了什么。

“So Jose's not someone who gets easily excited by things. He's like a very seasoned researcher. So when he had that visceral reaction, I think that was the first moment when we felt that, OK, we were on to something with the system.”


59:01 最终问答与结语

本节重点

详细精要

💬 精华片段(中文)

我们一方面要保留所有细节,但也要告诉科学家应该把时间和精力花在哪儿——也许这就是最令人信服或最有趣的假设,建议你优先阅读。

“One thing we try to do is … we want to have all the details in the reports. But we also tell the scientists where to spend time and attention on.”


专业术语注释

术语 解释
Med‑PaLM 谷歌 DeepMind 开发的医学调优大语言模型,首个在美国医师执照考试中达到及格和专家级分数的系统
AMIE 一个旨在构建和普及医疗超级智能的研究项目
co‑scientist 演讲中介绍的多智能体系统,用作科学家的协作伙伴,生成并优化科学假设
假设生成(hypothesis generation) 利用背景知识自动提出新颖科学猜想的过程,本例中是系统的核心功能
系统 1 思维 心理学家丹尼尔·卡尼曼提出的快速、直觉、自动的思维模式,LLM 的默认生成常属于此类
系统 2 思维 慢速、审慎、需要刻意努力的逻辑推理思维,科学研究更需要这种模式
自对弈(self-play) AlphaGo/AlphaZero 采用的方法:智能体通过相互对局并接收胜负奖励信号来自我训练
强化学习(reinforcement learning) 通过奖励信号来调节智能体决策的机器学习范式
智能体脚手架(agentic scaffold) 以大语言模型为核心,配备工具、记忆和交互循环而形成的自动代理结构
多智能体系统(multiagent system) 由多个独立智能体协作、竞争或辩论的系统,如 co‑scientist 中的生成、审查、排名、改进智能体
Elo 评分 原用于棋类排名的统计学评分方法,此处用来对科学假设进行相对排序
认知谦逊(epistemic humility) 系统能够清晰表达自己不知道什么、对其假设的置信度及关键不确定性的能力
AlphaFold DeepMind 开发的预测蛋白质结构的深度学习模型,极高精度但任务专用
Gemini 谷歌 DeepMind 的多模态大语言模型家族,co‑scientist 基于其 Pro 和 Flash 变体
IC50 半数抑制浓度,反映药物体外抑制肿瘤细胞生长能力的药效指标
类器官(organoid) 体外培养的微型简化器官,用于模拟器官功能并进行药物测试
山中因子(Yamanaka factors) 一组转录因子(如 Oct4),能将成体细胞重编程为多能干细胞,发现者获诺贝尔奖
衰老细胞(senescent cells) 失去分裂能力但保持代谢活性的细胞,分泌炎症因子,与衰老和疾病有关
ACE 抑制剂 血管紧张素转化酶抑制剂,常用降压药
B2R 受体 缓激肽 B2 受体,在本研究中 ACE 抑制剂通过影响缓激肽并激活该受体导致神经退行
CRISPR 基因编辑技术,用于敲除或修改特定基因以验证功能

延伸思考

原文发表:May 27, 2026  ·  纪要生成:2026-06-22