▶ 原文链接
Dwarkesh播客:Michael Nielsen谈科学进步的识别、超长验证闭环与科技树的偶然性
来源: Substack | 嘉宾 Michael Nielsen | 日期 Apr 07, 2026
分类: 访谈
原文发表: Apr 07, 2026
纪要生成: 2026-04-20
全集重点
- 科学进步速度远超验证闭环速度:人类科学往往在实验验证完成前就已广泛采纳更优理论,不存在统一的标准化判断流程。
- AI驱动科学存在固有瓶颈:现有AI成果如AlphaFold高度依赖前期实验数据积累,难以自发完成类似广义相对论的范式跃迁类创新。
- 科技树存在极强路径依赖性:不同文明可能发展出完全不同的科学技术体系,未来跨文明贸易存在巨大潜在收益。
- 科学创新的核心瓶颈正在转移:随AI降低代码实现等常规工作成本,科研者的瓶颈逐步转向高价值创意、系统设计与深度理解能力。
嘉宾/话题简介
本期嘉宾Michael Nielsen是量子计算领域先驱、知名科学作家,著有量子计算权威教材、深度学习入门著作,同时是开放科学运动核心推动者,现任Astera Institute研究员。本期节目围绕科学进步的识别逻辑展开,结合狭义相对论、自然选择、日心说等经典科学史案例,探讨了科研验证闭环的超长滞后性、AI驱动科学的边界、科技发展的路径依赖等核心议题,同时分享了Nielsen个人的科研经历、学习方法与对未来科学体系的思考。
赞助信息
- Labelbox:其研究团队发布了全新的AI安全基准测试,现有安全基准认为针对顶级模型的攻击成功率仅为百分之几,但这些基准中的提示词并未反映真实恶意攻击者的写作方式。相关研究可在其官网查看,如有需求可通过
labelbox.com/dwarkesh联系。
- Mercury:推出了MCP功能,允许LLM访问用户的全部交易历史,包括附带的收据与内部备注,可高效完成2025年交易分类等财务工作,更多信息可访问
mercury.com。
- Jane Street:其机器学习工程师在GTC大会上分享了GPU优化工作流,展示了如何使用CUDA图、流与自定义内核缩短训练时间,相关演讲与代码已全部开源,该公司正在招聘,更多信息可访问
janestreet.com/dwarkesh。
分节详述
00:00:00 科学进步如何超越其验证闭环
本节重点
- 狭义相对论的诞生并非直接由迈克尔逊-莫雷实验驱动,爱因斯坦本人甚至称提出理论前未听说该实验。
- 科学史上的理论选择远非朴素证伪主义描述的那样简单,优秀科学家可能长期坚持已被学界广泛抛弃的理论。
- 日心说从提出到恒星视差的实验验证间隔超2000年,人类科学无需等待完整验证即可完成理论迭代。
详细精要
- 迈克尔逊-莫雷实验的真实历史定位:该实验初衷是验证以太风的存在,而非证伪以太理论,实验结果仅排除了部分以太假说,并未完全否定以太的存在。
- 迈克尔逊本人终身坚信以太存在,直到1920年代仍在开展相关验证实验,其去世前最后公开表态仍支持以太假说。
- 洛伦兹在爱因斯坦提出狭义相对论前已推导出洛伦兹变换的全部数学形式,但其将其解释为以太参考系下的动力学效应,而非时空本身的属性。
- 1940年代的μ子衰变实验首次从实验上明确支持狭义相对论的时空解释,此时距狭义相对论提出已过去35年。
- 朴素证伪主义的局限性:科学实验的结果无法直接证伪单一理论,往往可以通过增加辅助假设的方式挽救旧理论,不存在统一的判定标准。
- 庞加莱几乎已经掌握狭义相对论的全部核心假设,包括相对性原理与光速不变原理,但始终将长度收缩解释为粒子受外力挤压的动力学效应,未能完成范式跃迁。
- 爱因斯坦作为年轻研究者对旧理论的执念更少,得以跳出以太框架重新思考时空的本质,而资深学者往往受自身过往研究的束缚。
- 超长验证闭环下的科学进步:大量核心科学理论从提出到完成完整实验验证的周期长达数十年甚至上千年,学界在此之前已完成理论共识的构建。
- 公元前3世纪阿里斯塔克提出日心说,直到1838年人类才首次测量到恒星视差完成验证,间隔超2000年。
- 哥白尼提出日心说初期,其预测精度甚至不如拥有大量本轮修正的托勒密模型,也不具备更简洁的理论形式,但最终仍被学界逐步接纳。
- 牛顿万有引力理论的说服力来源于其同时解释了行星轨道、地面抛物运动与潮汐现象三大完全独立的领域,实现了跨场景的统一解释。
💬 精华片段(中文)
"实际上并不存在什么我们所有人都在使用的标准流程来调和这些分歧。伟大的科学家可能在科学界普遍改变观点之后很长时间内仍然坚持错误的看法。这里没有中心化的权威,也没有中心化的方法。"
"It’s not as though there’s some standard procedure that we’re all using to reconcile these things. Great scientists can remain wrong for a very long time after the scientific community has broadly changed its opinion. But there’s no centralized authority or centralized method."
00:17:51 牛顿是最后一位魔法师
本节重点
- 凯恩斯在关于牛顿的著名随笔中提出,牛顿并非理性时代的第一人,而是最后一位魔法师,其思想是迷信与现代科学的混合体。
- 牛顿对炼金术、神学的研究与他在物理学、数学上的研究采用了完全相同的严谨方法,二者在其学术生涯中并行开展了25年。
- 试图将科学简化为固定流程的尝试必然遭遇瓶颈,真正的突破性创新往往出现在现有方法论不再适用的领域,需要大量多样化的探索。
详细精要
- 牛顿的双重身份特征:牛顿的学术生涯同时包含现代科学研究与神秘学研究两部分,二者采用了同等严谨的研究方法,不存在本质差异。
- 凯恩斯在牛顿去世后获得其未公开手稿,发现他关于炼金术、神学的研究与《自然哲学的数学原理》具备同样的严谨性、准确性与严肃的表述风格。
- 牛顿的研究范式处于神秘学与现代科学的过渡阶段,其对世界的认知同时包含超自然假设与实证逻辑,是典型的过渡性人物。
- 科学方法论的固有边界:不存在可以覆盖所有科研场景的固定流程或启发式规则,现有方法适用的领域往往已经被充分挖掘,瓶颈必然出现在方法失效的区域。
- 科研从业者普遍会学习并复用过往成功的研究方法,因此不会在已有方法适用的领域遇到长期瓶颈,真正的难点集中在需要全新方法论的领域。
- 量子力学、进化论等突破性理论都完全超出了当时的常规研究框架,无法通过固定流程推导得出,需要研究者跳出既有认知边界。
- AI驱动科研的潜在瓶颈:如果将科研简化为固定流程的自动化,AI只能解决现有方法论覆盖范围内的问题,无法完成需要范式跃迁的突破性创新。
- 要突破创新瓶颈需要支持大量不同方向的独立研究项目,允许研究者探索看似无前景的方向,研究难度越高、周期越长,最终的突破价值也越大。
💬 精华片段(中文)
"牛顿并非理性时代的第一人。他是最后一位魔法师,是最后一位用不到一万年前开始构建我们知识遗产的先辈们同样的眼光,俯瞰可见世界与知识世界的伟大头脑。"
"Newton was not the first of the age of reason. He was the last of the magicians, the last great mind which looked out on the visible and intellectual world with the same eyes as those who began to build our intellectual inheritance rather less than ten thousand years ago."
00:23:26 为什么自然选择没有更早被发现
本节重点
- 自然选择的核心逻辑看似简单,但直到1859年才由达尔文与华莱士独立提出,其核心难点不在于提出人工选择的概念,而在于意识到其是整个生物圈演化的核心机制。
- 卢克莱修的早期演化思想与达尔文的自然选择存在本质差异,前者认为演化是一次性筛选过程,不包含持续渐变与所有生命共祖的核心假设。
- 19世纪地质学的发展提出了"深时"概念,证明地球存在时间远超宗教宣称的6000年,为自然选择提供了必要的时间尺度前提。
详细精要
- 自然选择的核心创新点:人工选择的逻辑已被农民、育种者熟知数千年,达尔文的核心贡献是证明该机制是整个生物多样性的核心驱动因素,并建立了跨领域的完整证据链。
- 达尔文在《物种起源》中汇总了地质学、古生物学、生物地理学等多领域的海量证据,证明自然选择可以解释几乎所有已观测到的生物现象。
- 托马斯·赫胥黎读完《物种起源》后曾感叹"我怎么会蠢到没想到这一点",侧面反映该理论的核心逻辑非常简洁,但将其上升为生物学核心机制的认知跨越极难完成。
- 自然选择未被更早提出的核心障碍:除认知层面的障碍外,19世纪前的科学界缺乏自然选择成立的必要前提假设,包括足够长的地球演化时间。
- 卢克莱修在公元前1世纪提出的演化思想仅包含一次性物种筛选的逻辑,不包含持续渐变、生命共祖等核心内容,与现代进化论存在本质差异。
- 1830年代查尔斯·莱尔提出的地质深时理论证明地球存在时间达数亿年,为自然选择的缓慢演化过程提供了必要的时间基础,此前宗教宣称的6000年地球年龄完全无法支撑演化逻辑。
- 平行创新的启示:达尔文与华莱士几乎同时独立提出自然选择理论,证明重大科学发现需要的前提条件成熟后,才会被研究者普遍触及,不存在脱离时代背景的孤立创新。
- 大航海时代的生物地理学考察积累了大量不同区域物种分布的证据,古生物学发现的化石证据展示了物种的演化序列,二者共同为自然选择理论提供了必要的事实基础。
- 自然选择理论提出初期没有单个压倒性的验证证据,需要长期的证据汇总才能逐步建立共识,与物理学理论的验证模式存在显著差异。
💬 精华片段(中文)
"与达尔文同时代的生物学家托马斯·赫胥黎读完《物种起源》后说:'我怎么会蠢到没想到这一点。'从来没有人读完《自然哲学的数学原理》后会想:'天呐,我怎么没抢在牛顿前面提出这些理论?'"
"There was this contemporaneous biologist with Darwin, Thomas Huxley, who read this and said, 'How extremely stupid to not have thought of this.' Nobody ever reads the Principia Mathematica and thinks, 'God, why didn’t I beat Newton to the punch here?'"
00:29:52 梯度下降能否发现广义相对论
本节重点
- AlphaFold的成功高度依赖蛋白质数据库中数十年积累的18万个蛋白质结构实验数据,AI部分仅占整体投入的很小比例,本质是数据驱动的拟合而非原理性发现。
- 大模型等AI系统并非传统意义上的科学解释,但其可以作为人类提取科学原理的中间载体,未来可能成为全新类型的科学研究对象。
- 单一梯度下降等优化方法无法完成范式跃迁类的科学创新,这类创新需要同时维持多个独立研究方向,允许长期无明确验证结果的探索。
详细精要
- AlphaFold的科学价值定位:AlphaFold代表了数据驱动的拟合类科研成果,与传统基于第一性原理的科学理论存在本质差异,不具备广域的解释能力。
- 蛋白质数据库的构建耗时数十年、投入数十亿美元,积累了18万余个实验测定的蛋白质结构,AlphaFold本质是对这些数据的高精度拟合,AI训练的投入占整体成本的比例极低。
- 广义相对论等第一性原理理论可以预测其提出时完全未观测到的现象(如水星进动),而AlphaFold的预测能力局限于训练数据覆盖的场景,不具备外推的解释性。
- AI系统作为科研中间载体的可能性:尽管大模型本身不是科学解释,人类可以通过可解释性研究从模型中提取全新的科学原理,将其作为科研的知识来源。
- AlphaZero的对弈策略已被世界冠军Magnus Carlsen借鉴,显著改变了其比赛风格,证明人类可以从AI系统中提取可复用的有效知识。
- 未来可能出现专门针对大模型的知识提取方法论,将模型内部隐式存储的规律转化为人类可理解的显式科学原理。
- 大模型也可能成为一种全新类型的科学对象,类似Mathematica等工具可以处理过去人类无法处理的复杂方程,大模型可以支撑过去无法开展的复杂研究。
- AI实现范式跃迁创新的核心障碍:现有AI优化方法如梯度下降倾向于局部最优解,无法完成需要全局视角的范式转换,也无法主动提出现有理论的内在矛盾作为创新切入点。
- 爱因斯坦提出广义相对论的核心动机是发现狭义相对论与牛顿引力的内在矛盾:狭义相对论要求信息传播不能超光速,而牛顿引力是超距作用,二者存在根本冲突,这一矛盾是驱动创新的核心动力。
- 天王星轨道异常通过假设海王星存在解决,验证了牛顿力学的正确性,而水星轨道异常则需要推翻牛顿力学引入广义相对论,事前无法判断哪种路径正确,必须同时支持多方向探索。
- 1990年代先驱者探测器轨道异常最终被证明是热辐射不对称导致的,99.9%的理论异常最终都是普通误差原因,只有极少数会导向重大理论突破,事前无法区分二者。
💬 精华片段(中文)
"AlphaFold其实和AI关系不大。它的成功很大程度上归功于蛋白质数据库,是X射线衍射、核磁共振、冷冻电镜技术以及投入数十亿美元获得的18万余个蛋白质结构共同带来的成果。"
"AlphaFold really isn’t about AI. A massive fraction of the success there is the Protein Data Bank. It’s X-ray diffraction, NMR, cryo-EM, and the several billion dollars that were spent obtaining those 180,000-odd protein structures."
00:50:54 为什么外星人会拥有与我们不同的科技栈
本节重点
- 人类当前的科技发展仅触及科技树的极小部分,不同文明由于感知方式、发展路径的差异,完全可能演化出完全不同的科学技术体系。
- 科学领域的"低垂果实"会随新领域的开辟不断出现,计算机科学、量子计算等新领域的涌现反复打破了边际收益递减的预期。
- 科技发展的强路径依赖性意味着不同文明之间存在巨大的潜在贸易收益,知识、工艺能力的差异会带来持续的比较优势。
详细精要
- 科技树的规模远超人类现有认知:人类当前的科学探索仅触及宇宙可能存在的规律的极小部分,不存在固定的"标准科学体系",发展路径高度依赖初始条件与选择。
- 理论计算机科学在1930年代就已由图灵、丘奇等奠定了"万物理论"基础,但此后90年仍不断涌现公钥加密、加密货币等极为深刻的非显式规律。
- 人类对物态的认知从最初的固液气三态,已扩展到超导体、超流体、玻色-爱因斯坦凝聚、量子霍尔系统等数十种,未来仍将持续发现全新物态,证明规律探索的空间极大。
- 不同文明的感知方式差异会显著影响其科技发展路径,如以听觉为核心感知方式的文明,其科学规律的表达形式、优先探索方向都会与人类产生巨大差异。
- 新领域不断打破边际收益递减假设:科学发展不存在固定的边际收益递减趋势,全新领域的开辟会不断带来新的低垂果实,允许年轻研究者快速取得重大突破。
- 计算机科学本质是1930年代数学哲学研究的意外产物,该领域的涌现完全超出了当时的科学发展预期,带来了持续数十年的高速突破期。
- 深度学习、CRISPR等新领域出现后,21岁的年轻研究者也可以取得重大突破,无需花费数十年掌握过往的全部知识,证明新领域会重置创新的门槛。
- 当前看似资本密集的前沿领域(如大模型训练)本质是注意力集中的结果,而非科技发展的必然趋势,大量其他领域仍存在低投入高回报的创新机会。
- 路径依赖性带来的跨文明贸易收益:不同文明的科技发展路径差异会形成巨大的比较优势,即使是高度发达的文明也可以从其他文明的科技成果中获得巨大收益。
- 即使可以自由交换知识,工艺能力、制造体系的差异也会持续存在比较优势,如外星文明的制造体系可能完全无法复制人类基于碳基生物演化出的蛋白质分子机器。
- 地球生物圈的蛋白质分子、细胞机制本质是40亿年演化形成的"外星技术库",人类至今仅理解其中极小部分,已从中获得了胰岛素、mRNA疫苗等巨大收益,侧面证明跨技术体系的贸易价值极高。
- 科技路径的差异也使得文明间的友好协作比征服更具收益,显著改变了未来文明互动的底层逻辑。
💬 精华片段(中文)
"如果你在某一个时间点静态观察科学进步,可能会觉得低垂果实被摘完了收益递减。但如果有人站在甜品台后面不断补充新的甜品,可能不久之后就会出现好得多的甜品,你会转而选择那些。"
"If you look at a very static snapshot in time of scientific progress, maybe there's some truth to that. But if somebody is standing behind the dessert table and is replenishing and restocking the desserts and keeps adding new ones in, it may turn out that a little bit later, much better desserts appear, and you're going to go and eat those instead."
01:15:26 是否存在无限多的深层科学原理等待发现
本节重点
- 现有研究证明科技进步需要的科研人员数量逐年提升,存在边际产出下降的趋势,但这一趋势是由外部制度、工具限制导致的,而非科学规律本身的固有属性。
- 人类历史上的重大发展跃迁(农业革命、工业革命、AI革命)不断重置增长速率,未来仍可能出现人类当前完全无法想象的全新跃迁阶段。
- 量子计算的应用潜力仍未被充分探索,当前的认知局限于40年的理论研究阶段,尚未拥有实际可用的大规模量子计算机,未来可能带来完全超出预期的突破。
详细精要
- 深层科学原理的数量可能远超预期:人类已发现的诺特定理、丘奇-图灵论题等深层原理只是宇宙规律的极小部分,每个基础领域内部都会不断涌现新的深层规律。
- 图灵机的基础规则中隐含了公钥加密、分布式账本等极为深刻的规律,这些规律在图灵机提出后数十年才被逐步发现,证明基础规则可以衍生出几乎无限的深层衍生规律。
- Bloom等人的研究证明特定领域的科技进步需要的科研人员数量逐年提升,如半导体领域维持摩尔定律需要的科研人员每年增长9%,但这类研究仅聚焦于窄领域的单一指标,未考虑新领域开辟的影响。
- 科技进步边际产出下降的外部原因:当前观察到的边际产出下降并非科学本身的固有属性,而是由人类心智能力、科研制度、工具水平的限制导致的,这些限制可以被突破。
- 1700年之前的科学进步极慢且经常出现知识失传,本质是缺乏稳定的科研制度、公开披露机制、研究者安全保障等外部条件,这些条件成熟后科学进步速率出现了爆发式提升。
- AI、自动化科研仪器如詹姆斯·韦伯望远镜等工具的普及,可能再次突破现有科研的能力边界,重置科技进步的速率曲线。
- 未来发展跃迁的不可预测性:人类历史上的重大跃迁(农业革命、工业革命、AI革命)的间隔不断缩短,未来仍可能出现人类当前完全无法概念化的全新发展阶段。
- 量子计算可能带来超越经典AI的全新智能形态(AQGI),其能力边界完全超出当前经典计算机的理论框架,可能成为AI之后的下一次重大跃迁。
- 当前对量子计算应用的认知仅局限于Shor算法、量子搜索等少量已知场景,类似于1700年代人类对计算机的认知仅局限于与或门,完全无法预测其未来的全部应用场景。
💬 精华片段(中文)
"你不可能和一群黑猩猩讨论拥有语言是什么感觉。过去的重大跃迁本身就是无法被跃迁前的主体预测的,未来的跃迁很可能也是如此。"
"You can't speculate with a bunch of chimpanzees about what it would be to have language. Just to pick a major transition in the past, the transition itself is the thing. It seems likely."
01:26:25 是什么吸引Michael Nielsen早期投身量子计算领域
本节重点
- 量子计算理论本可在1950年代由冯·诺依曼等学者提出,但直到1980年代才由费曼、Deutsch奠定基础,核心是当时个人计算机普及、单量子态操控技术成熟两大外部条件的共同作用。
- Nielsen在1992年通过导师Gerard Milburn接触到量子计算的早期核心论文,意识到该领域具备极高的基础价值且存在大量未解决的低门槛问题,因此选择投身该领域。
- 重大科研方向的选择本质是寻找与个人能力、兴趣匹配的低悬果实区域,优秀的学术领路人的品味对年轻研究者的方向选择有决定性影响。
详细精要
- 量子计算领域诞生的历史偶然性:量子计算的理论基础本可在1950年代被提出,但直到1980年代才正式诞生,是两大外部条件成熟的共同结果。
- 1980年代个人计算机开始普及,计算的重要性被更广泛的学者认知,费曼本人当时对新购入的个人计算机极为痴迷,甚至曾在搬运时摔倒受伤。
- 1980年代保罗阱技术成熟,人类首次实现了单离子的捕获,具备了操控单个量子态的实验基础,为量子计算的可行性提供了实验支撑。
- 冯·诺依曼作为同时精通计算理论与量子力学的学者,本可在1950年代提出量子计算理论,但当时缺乏上述两大外部条件,因此未能产生相关思想。
- Nielsen投身量子计算的个人经历:Nielsen在1992年读本科时通过导师接触到量子计算的早期论文,意识到该领域的巨大潜力与大量未解决的问题,因此选择投身该方向。
- 导师Gerard Milburn是量子计算领域的早期研究者,曾提出首个实际系统的量子计算实现方案,为Nielsen提供了费曼1982年论文、Deutsch1985年论文等核心文献。
- Deutsch1985年的论文提出了量子图灵机可以高效模拟任意物理系统的核心猜想,同时探讨了量子算法与波函数意义的关联,这些深刻的基础问题吸引了Nielsen的研究兴趣。
- 1992年全球仅有极少数研究者从事量子计算研究,领域内存在大量低门槛的可解决问题,具备极高的投入产出比。
- 科研方向选择的核心逻辑:年轻研究者的方向选择本质是匹配个人能力与领域的未开发空间,优秀领路人的学术品味是识别高潜力方向的核心辅助。
- 香农的信息论在1940年代提出后,大量研究者意识到其跨领域的通用性,选择跟进研究,最终构建了现代信息科学的完整体系,与量子计算的发展路径高度相似。
- 高潜力方向的核心特征是:涉及基础科学问题、现有研究极少、存在大量可落地的未解决问题,研究者可以快速取得进展并做出实质性贡献。
💬 精华片段(中文)
"理查德·费曼在1980或1981年左右买到了最早的一批个人电脑,据说他对这个设备非常兴奋,搬着全新的电脑时甚至绊倒自己受了重伤。"
"There's a story about Richard Feynman. He went and got one of the first PCs around 1980 or 1981. He was apparently so excited with this device, he actually tripped and hurt himself quite badly carrying his brand-new computing device."
01:35:29 科学是否需要新的credit分配机制
本节重点
- 开放科学运动已取得显著成功,开放获取论文、公开代码、公开数据已成为科学界的普遍共识,改变了科研的底层政治经济逻辑。
- 现代科学的credit分配体系仍建立在印刷时代的论文机制上,尚未对代码、数据、未完成想法等新型科研产出建立对应的credit分配规则。
- 大型科研项目如LHC的参与作者超过千人,已没有任何单个研究者可以掌握项目的全部细节,集体科研已成为前沿研究的常态。
详细精要
- 开放科学运动的进展与成果:开放科学的核心概念已被科学界广泛接受,从边缘议题变为主流共识,显著改变了科研的底层运行逻辑。
- 20年前"开放科学"还是需要专门解释的新概念,现在已普遍被理解为包含开放获取论文、公开代码、公开数据等核心内容的共识性要求。
- "公共资助的科研成果应该是开放科学成果"已成为广泛接受的论据,推动了大量公共资助项目的开放政策出台,本质是对科研政治经济逻辑的重构。
- 印刷时代的科学家曾通过发布字谜的方式抢占科研发现的优先权,经过数百年的演化才形成了现代论文发表与credit分配体系,而当前的体系已不再适配数字时代的科研需求。
- 现有credit分配体系的缺陷:当前的科研credit分配仍以同行评议的论文为核心,未覆盖数字时代大量新型科研产出的贡献,导致研究者缺乏公开中间产出的动力。
- 物理学界长期存在预印本文化,研究者通过上传预印本抢占优先权,而生物学界曾长期反对预印本,认为会损害优先权,证明credit分配规则是社会建构的产物,而非固有规律。
- 代码、数据集、未完成的研究想法等新型科研产出尚未建立对应的credit分配机制,研究者公开这些产出无法获得对应的职业回报,阻碍了科研效率的提升。
- 集体科研时代的挑战:前沿大型科研项目的复杂度已超出单个研究者的能力边界,需要数千名不同领域的专家协作完成,传统的个人credit分配体系已不再适用。
- 大型强子对撞机(LHC)的希格斯玻色子发现论文作者超过千人,不同研究者分别掌握加速器物理、探测器物理、量子场论、逆问题求解等不同细分领域的知识,没有任何人可以掌握全部细节。
- 集体科研模式需要新的credit分配机制,能够公平衡量不同细分领域研究者的贡献,避免核心贡献者被埋没、边缘参与者获得不当credit的问题。
💬 精华片段(中文)
"如果你观察伽利略和开普勒,他们公开研究成果的方式非常奇怪。有时他们会做一些奇特的事情,把部分研究成果以字谜的形式发布。他们做出某个发现后,把结果写成一句话,打乱字母顺序发布出来。如果之后其他人做出了同样的发现,他们就会把字谜解出来,说:'哦,是的,其实我早就发现了。'"
"If you look at people like Galileo and Kepler, the extent to which they publicly disclosed was done in a very odd way. Sometimes they did bizarre things where they published some of their results as anagrams. They'd find some discovery, write down the result in a sentence, scramble it, and publish that. Then if somebody else later made the same discovery, they would unscramble the anagram and say, 'Oh, yeah, I actually did it first.'"
01:43:57 多产与深度的平衡
本节重点
- 创造性工作包含常规工作与高方差工作两类,常规工作应尽可能提高效率、避免拖延,高方差工作则需要投入足够的时间、允许长期无产出的探索。
- Dean Keith Simonton提出的等概率规则认为,研究者的任意一项产出取得重大成功的概率是固定的,高产出的研究者更有可能做出重大贡献。
- 大量天赋极高的研究者因追求完美、害怕公众评判而长期不产出成果,最终未能实现其潜力,这类失败案例比成功案例更具参考价值。
详细精要
- 创造性工作的两类任务划分:任何创造性工作都可以划分为常规任务与高方差探索任务两类,二者需要完全不同的时间管理策略。
- 常规任务包括文献整理、代码实现、常规实验等,应尽可能提高效率、避免拖延,必要时可以外包,减少其占用的核心创新时间。
- 高方差探索任务包括提出新猜想、跨领域交流、范式跃迁类思考等,需要投入大量无明确产出的时间,允许试错与长期停滞,无法通过提高效率压缩时间。
- 多数研究者倾向于擅长其中一类任务,忽略另一类,平衡二者的时间分配是取得持续高产出的核心。
- 多产与成功的关联规律:等概率规则显示,研究者的任意一项产出取得重大成功的概率相对固定,因此更高的产出频率对应更高的重大贡献概率。
- 爱因斯坦1905年的奇迹年发表了4篇诺奖级别的论文,即使剔除狭义相对论与光电效应,剩余的两篇论文仍足以使其跻身顶级科学家行列,证明高产出与高深度并不矛盾。
- 哥德尔等少数极端案例虽然产出极少但贡献极大,但这类案例属于极少数例外,不具备普遍参考价值,普通研究者遵循高产出策略的成功概率更高。
- 高天赋研究者的常见失败模式:大量天赋极高的研究者因过度追求完美、害怕公众评判而长期不发表成果,最终未能实现其学术潜力。
- 很多IMO金牌得主、顶尖大学毕业生在进入科研领域后未能取得预期成就,核心原因之一是过度追求重大成果,不愿发表增量工作,最终长期无产出。
- 现有科学史研究过度聚焦于成功案例,缺少对高天赋失败者的系统研究,后者的经验教训对普通研究者更具参考价值。
💬 精华片段(中文)
"Dean Keith Simonton提出了著名的等概率规则,认为一个人一生中发布的任意一项成果(论文、书籍等)取得极高重要性的概率差异不大。决定一个人在某个时期最高产的核心因素是其发布成果的数量,任意一项成果取得重大成功的概率是相等的。"
"Dean Keith Simonton has this famous equal odds rule where he says the probability that any given thing you release—any paper, book, whatever—will be extremely important for a given person through their lifetime is not that different. What really determines in what era they are the most productive is how much they're publishing. Any given thing has equal odds of being extremely important."
01:49:17 真正内化所学知识需要什么
本节重点
- 播客采访等表面接触的学习方式容易导致肤浅理解,只有设置足够高的要求、存在明确的输出与考核目标,才能实现知识的深度内化。
- 深度学习知识的核心是设置高 stakes 的输出目标,如写书、开课、解决具体问题等,需要长期卡在难点上的过程才能实现长期记忆与深度理解。
- AI工具的普及容易导致学习者回避最困难的深度思考过程,将表面的信息获取误认为深度理解,需要主动设置障碍避免这种替代效应。
详细精要
- 表面学习的常见陷阱:播客采访、阅读博客等学习方式如果没有对应的输出要求,很容易导致肤浅理解,知识会快速遗忘,无法形成长期积累。
- 很多高产的播客采访了数百位各领域专家,但并未形成深度的知识积累,核心原因是没有设置强制内化的机制,每次采访都是独立的浅度接触。
- 知识内化需要"夹紧"的核心概念,如学习深度学习时亲手实现Transformer、学习芯片设计时完成屋顶线分析等,只有掌握这些可验证的核心技能,才能避免知识的肤浅化。
- 深度内化的核心方法:实现知识深度内化的核心是设置高要求的输出目标,主动提高学习的 stakes,通过解决具体问题、创造产出的过程完成知识整合。
- 花费3-6个月写成的长文带来的知识内化程度远高于几天写成的短文,卡在难点上的痛苦过程是知识内化的核心标志,没有这个过程的学习都是浅度的。
- 播客主持人可以通过每次采访后写2000字的深度总结、设计对应领域的练习题目、采访后开课或写书等方式,强制自己完成知识的深度内化。
- 不同人对"深入研究"的定义差异极大,有人认为读几篇博客就算深入,有人认为写一本书才算深入,自我要求的标准直接决定了学习的深度。
- AI时代的学习挑战:AI工具的普及降低了获取信息的难度,但也容易让学习者回避最困难的深度思考过程,将与AI的表面互动误认为深度学习。
- 与大模型的对话虽然可以快速获得答案,但会替代学习者自己思考中间步骤的过程,导致知识无法内化,本质是用低价值的信息获取替代高价值的思考过程。
- Alan Kay曾指出,学习Linux等具体系统的细节很容易让人产生学到知识的错觉,但这些知识大多不可迁移,只有掌握可迁移的基础原理才算真正的学习。
💬 精华片段(中文)
"有趣的是,卡在难点上的时间是极其重要的。过去我觉得这很烦人,现在我甚至觉得这可能是整个过程中最重要的部分。这种来之不易的性质意味着我之后会把它内化。我曾在几天内写过1万字的文章,也花过3个月或6个月写过同样长度的文章。我觉得那些只花了几天写的文章我没学到多少东西,而那些花了3个月的,15年后我仍然记得。"
"Funnily enough, spending time stuck is incredibly important. That used to just be annoying. Now it seems like it's maybe even the most important part of the whole process. That hard-won nature of it means that I internalize it afterwards. I've written 10,000-word essays in a couple of days, and I've written them in three months or six months. I feel like I didn't learn very much from the ones that only took a couple of days. Whereas some of the ones that took three months, 15 years later, I'll still remember."
专业术语注释
| 术语 |
解释 |
| RL(强化学习)(Reinforcement Learning) |
本集中指AI用于科学发现时的验证闭环机制,即AI提出假设后通过实验获得反馈迭代模型的过程 |
| 迈克尔逊-莫雷实验(Michelson-Morley Experiment) |
1887年开展的物理实验,初衷是测量地球相对于以太的运动速度,实验结果未观测到以太风,成为狭义相对论的重要实验基础 |
| 狭义相对论(Special Relativity) |
爱因斯坦1905年提出的时空理论,核心假设为相对性原理与光速不变原理,推翻了牛顿的绝对时空观 |
| 以太(Ether) |
19世纪前物理学家假设的光传播的介质,被迈克尔逊-莫雷实验证伪,最终被科学界抛弃 |
| 洛伦兹变换(Lorentz Transformation) |
狭义相对论中不同惯性参考系之间的坐标变换公式,由洛伦兹在爱因斯坦提出狭义相对论前推导得出 |
| 恒星视差(Stellar Parallax) |
由于地球绕太阳公转,观测者在不同时间观测同一恒星时的位置差异,是日心说的核心验证证据,1838年首次被测量 |
| 托勒密模型(Ptolemaic Model) |
古希腊天文学家托勒密提出的地心说模型,通过增加本轮的方式可以高精度预测行星轨道,在中世纪被广泛接受 |
| 量子力学(Quantum Mechanics) |
描述微观粒子运动规律的物理学分支,诞生于20世纪初,是现代物理学的两大支柱之一 |
| 自然选择(Natural Selection) |
达尔文进化论的核心机制,指生物的可遗传变异在生存竞争中被环境筛选,适者生存的过程,是生物演化的核心驱动力 |
| 深时(Deep Time) |
地质学概念,指地球的存在时间达数亿到数十亿年,为生物演化提供了必要的时间尺度,由19世纪地质学家查尔斯·莱尔提出 |
| AlphaFold |
DeepMind开发的蛋白质结构预测AI,通过学习蛋白质数据库中的实验结构,实现了高精度的蛋白质3D结构预测 |
| 蛋白质数据库(Protein Data Bank, PDB) |
全球共享的蛋白质3D结构数据库,存储了通过X射线衍射、冷冻电镜等实验测定的数十万蛋白质结构,是AlphaFold的核心训练数据来源 |
| 梯度下降(Gradient Descent) |
机器学习中最常用的优化算法,通过沿损失函数的负梯度方向更新模型参数,最小化损失函数,本集中用来代指AI的常规优化逻辑 |
| 广义相对论(General Relativity) |
爱因斯坦1915年提出的引力理论,将引力描述为时空的弯曲,是现代宇宙学的核心基础 |
| 牛顿力学(Newtonian Mechanics) |
牛顿提出的经典力学体系,描述宏观低速场景下的物体运动规律,在广义相对论提出前被视为绝对正确的物理理论 |
| 丘奇-图灵论题(Church-Turing Thesis) |
计算机科学的核心基础假设,认为任何可有效计算的函数都可以用图灵机实现,是现代计算机的理论基础 |
| 公钥加密(Public-Key Cryptography) |
一种加密算法,使用成对的公钥与私钥,公钥公开用于加密,私钥私密用于解密,是现代互联网安全的核心基础 |
| 复杂度类(Complexity Class) |
计算复杂性理论中根据问题的计算资源需求(时间、空间等)划分的问题类别,如P、NP、BQP等 |
| 摩尔定律(Moore's Law) |
英特尔创始人戈登·摩尔提出的经验规律,指集成电路上可容纳的晶体管数量每18-24个月翻一番,驱动了半导体行业数十年的高速发展 |
| 量子计算(Quantum Computing) |
利用量子力学原理进行计算的新型计算范式,理论上可以在特定问题上实现远超经典计算机的加速,如Shor算法可以快速破解RSA加密 |
| Shor算法(Shor's Algorithm) |
量子计算领域的标志性算法,可以在多项式时间内分解大整数,对现有经典加密体系构成根本性威胁 |
| 费曼(Richard Feynman) |
美国著名物理学家,量子电动力学创始人之一,1965年诺贝尔物理学奖得主,1982年首次提出量子计算的概念 |
| Deutsch(David Deutsch) |
英国物理学家,量子计算领域的先驱,1985年提出量子图灵机模型,奠定了量子计算的理论基础 |
| 开放科学(Open Science) |
倡导科研成果、数据、代码、方法等公开共享的科研运动,目标是提高科研效率、促进科研公平 |
| 大型强子对撞机(Large Hadron Collider, LHC) |
位于欧洲核子中心的世界最大粒子加速器,2012年通过对撞实验发现了希格斯玻色子,验证了粒子物理标准模型的预测 |
| 希格斯玻色子(Higgs Boson) |
粒子物理标准模型预言的基本粒子,是其他粒子获得质量的来源,2012年在LHC上被发现 |
| Transformer |
2017年提出的深度学习架构,基于自注意力机制,是当前大语言模型的核心基础架构 |
延伸思考
- 如何设计新的科研credit分配机制,适配数字时代的代码、数据、中间想法等新型科研产出,从而进一步提升科研协作效率,是未来科学制度建设的核心议题。
- AI驱动科研的边界在哪里?如何让AI具备发现现有理论内在矛盾、完成范式跃迁的能力,而非仅局限于数据拟合类的局部优化,是AGI时代的核心科研问题之一。
- 科技树的强路径依赖性对当前人类科技发展的选择有何启示?是否存在我们当前主动放弃的技术路径,未来可能带来远超现有路线的收益?
- 个人学习中如何平衡AI工具的效率提升与深度思考的需求?如何设计强制内化的学习机制,避免被表面的信息获取替代深度的知识整合,是AI时代每个人都需要解决的问题。
- 未来科学研究的集体化趋势是否会进一步加强?如何在集体协作中保留个体的独立探索空间,避免共识偏见扼杀突破性创新,是科研组织需要解决的核心问题。
原文发表:Apr 07, 2026 · 纪要生成:2026-04-20