来源: Substack | 嘉宾:陶哲轩(Terence Tao) | 主持人:Dwarkesh Patel 分类: 其他 原文发表: Mar 20, 2026 纪要生成: 2026-04-20
陶哲轩(Terence Tao)是当今世界最具影响力的数学家之一,菲尔兹奖得主,在数论、组合数学、调和分析等多个领域有突破性贡献。本集播客中,他从开普勒发现行星运动定律的历史出发,探讨AI对科学研究尤其是数学研究的影响,涉及AI成果筛选、人机协作模式、未来科研范式变革等核心议题,为AI时代的科研从业者提供了方向性参考。
本节重点 - 开普勒通过20年试错结合第谷的高精度观测数据,发现行星运动三大定律,过程类似大模型批量生成假设再验证。 - 科学研究包含问题识别、数据收集、假设生成、验证等多环节,假设生成已不再是当前科研的瓶颈。 - 现代科研已从“先提出假设再验证”转向“先收集海量数据再挖掘规律”,数据精度与规模成为核心前提。
详细精要
💬 精华片段(中文)
"We celebrate Kepler, but we should also celebrate Brahe for his assiduous data collection, which was ten times more precise than any previous observation. That extra decimal point of accuracy was essential for Kepler to get his results."
本节重点 - AI生成内容的泛滥已超出传统同行评审体系的承载能力,无法仅靠人工筛选高价值科研成果。 - 重大科学理念的价值往往需要时间检验,且受社会文化、技术路径依赖的影响,无法通过单一指标客观评估。 - 科学进步往往需要放弃固有认知假设,当前人类正经历认知层面的哥白尼革命,重新定位人类智能的价值。
详细精要
💬 精华片段(中文)
"Right now we’re going through a cognitive version of the Copernican revolution, where we used to think that human intelligence is the center of the universe, and now we’re seeing that there are very different types of intelligence out there with very different strengths and weaknesses. Our assessment of which tasks require intelligence, which ones don’t, has to be reordered quite a bit."
本节重点 - 天文学领域长期面临数据稀缺问题,天文学家已经形成从有限数据中榨取全部信息的成熟方法论,可迁移到其他科研领域。 - 现有科研数据中存在大量未被挖掘的隐藏信息,可通过巧妙的指标设计提取额外结论。
详细精要
💬 精华片段(中文)
"Astronomers are world-class in extracting all kinds of conclusions from little traces of data, almost like Sherlock."
本节重点 - AI辅助解决50余个埃尔德什问题后已进入瓶颈期,纯AI自主解决问题的成功率仅为1%~2%,公开报道多为筛选后的成功案例,存在明显选择偏差。 - AI擅长短处探索,人类擅长深度推导,二者能力互补,需要重构科研范式发挥AI的广度优势。 - 当前AI只能应用已知技术解决问题,尚未具备发明新技术填补论证漏洞的能力。
详细精要
💬 精华片段(中文)
"If you only focus on the success stories, the ones that get broadcast on social media, it looks amazing. All these problems that haven’t been solved for decades, now they’re falling. But whenever we do a systematic study, on any given problem an AI tool has a success rate of maybe 1% or 2%."
本节重点 - 陶哲轩2023年预测2026年AI可成为值得信任的数学合著者,该预测已基本实现。 - AI目前主要提升辅助性科研任务的效率,让论文包含更多图表、代码、文献调研内容,但尚未能提升核心问题解决的效率。 - 现有AI缺乏累积进步能力,无法基于部分进展持续迭代思路,本质是“人工小聪明”而非真正的智能。
详细精要
💬 精华片段(中文)
"They’ve really sped up lots of secondary tasks. They haven’t yet sped up the core thing that I do, but it’s allowed me to add more things to my papers. By the same token, if I were to write a paper I wrote in 2020 again—and not add all these extra features, but just have something of the same level of functionality—it actually hasn’t saved that much time, to be honest. It’s made the papers richer and broader, but not necessarily deeper."
本节重点 - 部分数学问题可通过蛮力枚举解决,无法提供概念层面的洞察,例如四色定理,但黎曼假设这类核心问题大概率需要新的数学理论才能解决。 - Lean等形式化证明工具可将证明拆分为原子化的引理,便于人类识别核心创新步骤,不用担心AI生成的证明无法被理解。 - AI生成的证明可通过后续的人工或AI重构、提炼,转化为可被人类理解的内容,相关的证明后处理领域正在快速发展。
详细精要
💬 精华片段(中文)
"Some people are concerned about what happens if the Riemann hypothesis is proven with a completely incomprehensible proof. I think once you have the artifact of a proof, we can do a lot of analysis on it."
本节重点 - 当前只有数学证明有完整的形式化语言(ZFC公理体系、一阶逻辑),但科研策略、猜想可信度评估等环节仍缺乏可被自动化的半形式化框架。 - 数论领域基于统计数据形成的素数随机模型是半形式化科研框架的典型案例,该模型虽不严谨但预测准确率极高,是学界共识的核心基础。 - 可通过模拟AI解决简单问题的过程,研究科研策略的形式化方法,积累相关数据。
详细精要
💬 精华片段(中文)
"If there’s some framework that mimics how scientists talk to each other in a semi-formal way, using data and argument, but also constructing narratives... There’s some subjective aspect of science that we don’t know how to capture in a way that we can insert AI into it in any useful way. This is a future problem."
本节重点 - 陶哲轩将自己定位为“狐狸型”学者,擅长广泛了解多个领域知识,与“刺猬型”的深度专家合作开展研究。 - 写作博客是陶哲轩巩固学习成果的核心方法,可避免理解过的知识被遗忘。 - 陶哲轩认为非计划的随机互动、适当的分心是产生科研灵感的核心来源,反对将日程完全优化排满。
详细精要
💬 精华片段(中文)
"You actually do need a certain level of distraction in your life. It adds enough randomness and high temperature. I don’t know the optimal way to schedule my life. It just seems to work."
本节重点 - AI将在10年内完成当前数学学生、论文中的大部分常规工作,但人类会转向更高阶的问题,不会被完全替代。 - 人机混合模式将在很长时间内主导数学研究,当前AI仍缺乏核心的创新能力,只能作为辅助工具存在。 - 年轻数学研究者需要保持适应性思维,既要掌握传统数学知识,也要拥抱AI带来的新研究机会,非传统路径的贡献将越来越多。
详细精要
💬 精华片段(中文)
"I guess I do believe that hybrid human plus AIs will dominate mathematics for a lot longer. It will depend. It will require some additional breakthroughs beyond what we already have, so it’s going to be stochastic. I think AIs currently are very good at certain things, but really terrible at others. While you can add more and more frameworks on top to reduce the error rates and make them work with each other a bit more, it feels like we don’t have all the ingredients to really have a truly satisfactory replacement for all intellectual tasks."
| 术语 | 解释 |
|---|---|
| 行星运动三大定律(Kepler's Laws of Planetary Motion) | 开普勒提出的描述行星绕太阳运动的规律,包括轨道为椭圆、等面积定律、周期与距离的平方立方定律 |
| 柏拉图正多面体(Platonic Solids) | 仅有的五种正多面体,开普勒曾试图用其解释行星轨道的大小比例 |
| 日心说(Heliocentric Model) | 认为太阳是太阳系中心,行星绕太阳运动的天文模型,由哥白尼正式提出 |
| 地心说(Geocentric Model) | 认为地球是宇宙中心,其他天体绕地球运动的天文模型,由托勒密完善,统治西方科学界千年 |
| 平方立方定律(Square-cube Law) | 本集中指开普勒第三定律,行星公转周期的平方与轨道半长轴的立方成正比 |
| 反平方定律(Inverse-square Law) | 牛顿万有引力定律的核心,两个物体之间的引力与距离的平方成反比 |
| 埃尔德什问题(Erdős Problems) | 数学家埃尔德什提出的数百个未解决的数学问题,多为组合数学、数论领域的经典问题 |
| Lean | 一种交互式定理证明器,可将数学证明形式化,验证证明的正确性,当前被广泛用于AI辅助数学研究 |
| 黎曼假设(Riemann Hypothesis) | 千禧年大奖难题之一,猜想黎曼ζ函数的所有非平凡零点都位于临界线上,是数论领域最重要的未解决问题 |
| 四色定理(Four Color Theorem) | 任何一张地图只用四种颜色就能使具有共同边界的国家着上不同的颜色,是第一个通过计算机蛮力枚举证明的重要数学定理 |
| ZFC公理体系(Zermelo-Fraenkel Set Theory with Axiom of Choice) | 目前数学界通用的集合论公理体系,是绝大多数数学分支的逻辑基础 |
| 素数定理(Prime Number Theorem) | 描述素数分布规律的定理,指出不大于X的素数的个数约为X/ln(X) |
| 孪生素数猜想(Twin Prime Conjecture) | 猜想存在无穷多对相差为2的素数,是数论领域的经典未解决问题 |
| 千禧年大奖难题(Millennium Prize Problems) | 2000年克莱数学研究所提出的七个最重要的未解决数学问题,每个问题的解决者可获得100万美元奖金 |
| Transformer | 2017年提出的深度学习架构,是当前所有大语言模型的核心基础 |
| 贝叶斯概率(Bayesian Probability) | 概率的一种解释框架,将概率定义为个人对某一命题为真的信任程度,可根据新证据不断更新 |