热力学AI芯片 · Thomas Ahle

来源： YouTube | Thomas Ahle | Jun 28, 2026 分类： 其他 原文发表： Jun 28, 2026 纪要生成： 2026-06-29

全集重点

芯片设计中的AI代理革命：Thomas Ahle 团队用AI代理集群在43天内生成超过50万行代码，构建了Verilog模拟器，挑战了商业EDA工具的高昂成本，揭示了AI在硬件设计领域的巨大潜力与风险。
从“噪声是敌人”到“噪声即计算”：热力学计算颠覆传统芯片理念，不压制噪声，反而利用物理噪声执行随机计算，让芯片本身成为一道随机微分方程，为贝叶斯推理和高斯采样等概率工作负载提供了一种原生的物理加速范式。
代码生成中的“理解债务”危机：AI生成的代码虽能通过测试，却可能催生出难以理解、难以维护的“意大利面条怪兽”，这导致了“理解债务”的累积，阻碍了长期的技术迭代和深层抽象构建，让人类逐渐丧失对复杂系统的掌控。
自动形式化与验证的双重挑战：将人类设计意图（数千页规格文档）自动转化为形式化验证语言异常困难，目前强化学习在能构造奖励函数的环境下表现优，但在规格生成等环境构建困难的领域仍显乏力，硬件领域的信任构建是核心难题。
持续学习与AI自主进化：讨论了语言模型缺乏真正的持续学习能力，以及硬件平台如何通过“边学边推理”的特性自动刷新，这更接近人脑的自适应特性，同时也引发了关于AI安全和模型服务范式的深刻挑战。

嘉宾/话题简介

Thomas Ahle，一位横跨概率机器学习、形式化验证和芯片设计的“全才型”研究者，现任 Normal Computing 核心成员。他曾在牛津学习语言学，拥有理论计算机科学背景，专注高维数据算法。在本次对话中，他深入探讨了团队如何运用多智能体协作，在短短43天内生成超过50万行代码，自主构建了一个模拟复杂芯片设计的系统。同时，他详细阐述了 Normal Computing 推出的革命性热力学计算芯片 CN101，该芯片不依赖传统晶体管的0/1逻辑，而是直接利用电路的物理噪声来求解随机微分方程，为大规模矩阵求逆或贝叶斯推理开辟了全新的硬件路径。

分节详述

00:00 引言：AI工程与“理解债务”

本节重点

介绍 Thomas Ahle 深厚的理论计算机科学和芯片设计复合背景，以及他加入 Normal Computing 的初衷。
揭示了芯片设计从“工业制造”转向“代码生成”的重大范式转变。
抛出核心矛盾：AI代理生成的代码功能可用，但人类对其内在逻辑的理解日益稀薄，由此产生巨大的“理解债务”。

详细精要

嘉宾的跨界背景与使命：
Thomas 的学术根基在理论计算机科学，曾专注于高维数据算法和局部敏感哈希。
入职 Normal Computing 后，重心转向热力学计算，旨在加速贝叶斯智能，其工作模式被类比为“芯片设计领域的 Lovable”，即从设计意图出发，贯穿设计、优化、验证直至流片的全流程自动化。
该过程强调将复杂的物理制造流程，彻底抽象为自顶向下的代码工程。
芯片设计的根本性转变：“代码即芯片”：
过去，芯片始于工厂的物理制造；而在当前，芯片设计的起点完全是软件化的，工程师使用Verilog这种类似编程语言的硬件描述语言来设计整个电路。
这种高度并行的编程语言能够完美映射到硬件逻辑，但其代码必须经过严格的仿真和形式化验证，因为在硅片流片后，任何潜藏的Bug都可能导致灾难性后果。
“代码生成”的双刃剑：理解债务的隐忧：
当AI代理开始以人类无法企及的速度和规模生产代码时，人类不再是代码的直接作者，而是逐步退化为监督者。这种态势导致了一种新型的技术负债——理解债务。
这种债务意味着开发者可能对系统核心架构失去掌控，形成了一个无法被理性解构的“意大利面条怪兽”。这使得系统未来的架构演进、关键决策都建立在一个脆弱的、半知半解的基础之上，可能在未来5年内形成难以跨越的技术断层。

💬 精华片段（中文）

“这些日子，一颗芯片并不一定始于工厂，它可以从代码开始。”（These days, a chip doesn't necessarily start in a factory. It can start as code.）

01:01 代理革命：43天重构Verilog仿真器

本节重点

详细拆解商业EDA工具的极端昂贵性和封闭性，这是AI代理介入硬件设计的核心驱动力。
介绍Thomas团队长达6个月的惊人多代理持续运行实验，其产出的50万行代码是对传统工具的直接挑战。
探讨 AI 生成代码的核心评估悖论：我们不能只看测试通过率，而必须审视其是否能真正理解并内化深层结构。

详细精要

商业EDA的费用之殇与技术封锁：
商业仿真和验证工具的费用极其高昂，单个CPU核心的许可证费用就可能高达1万美元，如果要扩展数据中心规模，授权费用可能膨胀至100亿美元级别。
这种变态的高成本彻底锁死了AI模型在硬件领域进行规模化训练的可能性。模型既无法接触到海量的开源代码来训练，也没有廉价的环境去学习使用这些专有工具。
这与Python、JavaScript等软件生态的开源繁荣形成了“白天与黑夜”般的巨大反差，直接阻碍了通用AI在底层硬件设计的普及。
持久运行的AI代理集群实践：
Thomas团队在内部构建了一套AI驱动的EDA工具开发流程，并认为自己可能拥有世界上运行时间最长的代理之一。
他们让大约20个GPT代理持续运行了约6个月，并持续产出实质性进展。基于此，他们在博客文章中披露了使用AI集群生成50万行代码构造模拟器的实验。
这与Anthropic利用大量代理根据功能规格重写C编译器的思路遥相呼应，证明了依据现有自动化测试进行递归、多智能体生成是可行的。
基准测试的“烟雾弹”与真实性陷阱：
在经典的程序基准测试中，虽然最新模型（如Fable）可以达到80%的测试通过率，但这可能只是虚高的幻象。
与基准测试创建者的沟通揭示了一个残酷真相：如果程序只通过了70%的测试，它极大概率是完全错误或无法实质性工作的。
这背后是一个更深层的科学哲学问题——即是否可以通过外部行为来完整学习程序的内部结构。Thomas持保留态度，除非LLM在预训练数据中已经见过该程序的全部源代码，否则单纯的“行为主义”预测法难以触及真正的约束与架构。

💬 精华片段（中文）

“它确实在测试中达到了80%的正确率……但我和制作基准的人聊过，问题是：它真的正确解决了任何一个问题吗？”（it got like 80% tests correct. And it's like, yeah, but I talked with the people who made the benchmark and like, yeah, but did it get any of them actually right）

12:25 行为主义与逆向工程：重构内部的秩序

本节重点

从软件生成问题深入到认知科学，辩论“通过行为重构内部结构”的方法是否具有普适性。
讨论深度抽象和先验知识在人类和AI进行逆向工程中的决定性作用。
指出“片段化且不知全貌”的爬山式探索，本质上是一种基于强大生成-判别不对称性的智能活动。

详细精要

行为主义与程序结构的学习局限性：
针对仅通过观察外部接口（如I/O对）来猜测内部实现的做法，其有效性高度依赖于预训练先验。人类之所以能实现某些黑盒破解，是因为大脑中嵌入了针对特定领域（如视频编解码）的深层假设和常见模式。
例如，逆向工程FFmpeg中的冷门古老编解码器时，人类会在缺乏源代码和文档的情况下，基于对“视频编码通常会包含傅里叶变换、分块处理等”的理解来构建解码器。
这表明无论是人还是AI，在面对完全黑盒时，都是一个不断利用已有工具集，一步步试探，通过可视化输出和先验直觉来不断爬山逼近真相的过程。
生成与验证的不对称性及抽象提炼：
科学发现的过程体现了一种生成-判别不对称性：我们很难凭空生成全新的正确结构，但却非常善于判别一个给定结构是否正确。
在此过程中，人类会逐步将这种试探性步骤内化，提取出新的压缩变量和抽象。这正是智力的核心产物——将复杂性压缩为可复用的技能。
相比之下，目前的LLM在无持续学习的情况下，缺乏这种将试探过程中发现的“这部分等同于某种傅里叶变换”抽象出来并存储为新基元的能力，它们只是在临时的上下文中流转，但不会沉淀为永久的知识结构。

💬 精华片段（中文）

“我们无法生成，但我们可以很好地辨别。我们迈出这些步伐，当我们到达时，我们把它折叠成一个模型，那就是智力的产物。”（We can discriminate well, but we can't generate yet. But we take these steps, and then when we get there, we now kind of collapse that into a model, and then that's the artifact of the intelligence.）

16:44 抽象层级、语料重力与持续学习

本节重点

分析了LLM在预训练时能够习得抽象直觉，但在在线运行时却缺乏提取和升华新抽象的机制。
揭示了“持续学习”在AI安全与商业模式上的深层悖论，既被看作是突破智能极限的关键，又被部分机构视为巨大的泛滥风险。
详细探讨了Normal Computing在非传统计算基材上实现持续学习的自然优势，即其与物理世界的紧密耦合。

详细精要

预训练抽象与在线推理的断层：
LLM在预训练阶段确实通过海量语料获得了某种不可言说的代码直觉，使其在静态代码库中游刃有余。这种直觉可以被视为一种高层抽象。
然而，当LLM以代理形态实时运行时，它极其不擅长将推理过程中新创造出来的临时逻辑，主动识别并固化为新的永久性抽象。这限制了它处理超长周期、动态积累知识的复杂任务的能力。
持续学习的安全博弈与商业壁垒：
如Anthropic的Dario等人士认为，大模型如果拥有过强的在线学习能力，会极大地模糊安全对齐的边界，导致模型逐渐偏离受信任的校准状态，造成难以预估的安全失控。
从商业和技术架构看，如果要在推理时实时更新模型权重，则意味着“同一个模型服务所有客户”的现有范式将瓦解。
Thinking Machines 等公司提出的“共享基座模型+私有LoRA轻量级适配”或许是一种折中，但仍面临复杂的维护和状态管理挑战。
物理硬件中的自适应本质：
Normal Computing 研发的模拟电路和热力学芯片，本质上倾向于一种“永不停歇”的持续学习状态。这并非人为设计，而是物理约束的必然结果。
因为要让模拟电阻或电容的记忆持久，要么耗费巨大能量去人为刷新，要么不如让学习过程一直持续进行，使其自然地保持状态的动态均衡。
这种永远在变化和适应的硬件特性，与人类大脑中所有突触永远在动态调整的机制高度一致。真正智能的本质正是自适应性，而不是静态的冻结状态。

💬 精华片段（中文）

“在我看来，所有关于智能的词语中，适应性是排名第一的关键词。”（out of all of the words we can use to analogize intelligence, adaptivity is the number 1.）

21:01 硬件固化与递归式自我改进

本节重点

分析了AI加速芯片“ASIC化”与“通用化”的路线之争，以及AI的介入如何模糊了二者的界限。
提出了利用AI进行“递归式自我改进”的愿景，即AI辅助设计更高效的硬件，进而运行更强大的下一代AI。
强调这种向特化硬件倾斜的趋势，本质上是将一段极度优化的高阶知识直接“烘焙”到了硅片中。

详细精要

硬件特化与算法锁死：
过去，过度特化的硬件往往面临锁死上层软件算法创新的危险。相比之下，NVIDIA 的通用 GPU 由于相对灵活，虽然固有地推动了矩阵乘法的繁荣，但也给了软件层巨大的发挥空间。
然而，由于AI驱动的 EDA 工具大幅降低了硬件开发的门槛与周期，现在的趋势正从编写软件层面的 CUDA 内核，变成直接为特定算法设计专用的、极小批量的物理电路。
在未来，如果用户想出了一个绝妙的新算法，也许只需要用AI生成一段针对该算法的专用电路设计，就能高效地运行它。
递归式自我改进的正反馈闭环：
这一过程构成了一个完美的递归式自我改进闭环：用当前的AI辅助设计下一代软件和硬件，然后用这些更高效的新硬件去孵化和运行性能更强大的新一代AI。
这种硬件固化本质上是一种智力结晶。如果说人类的智力在于将复杂的动态过程提炼为可复用的粗粒度技能，那么 ASIC 定制化芯片就是这种智力在物理世界最极致的压缩表达——将复杂计算图中所有多余的部分剔除，以最高效的形态烧录进无适应性的物理介质中。
这引出了一个深刻的命题：真正的智能，其归宿是否是给自己打造一个越来越窄、越来越快的“思维棺材”？

💬 精华片段（中文）

“也许很快，当我们想设计CUDA内核时，我们不会再去写代码了，而是直接为每一件特定的事情，生成专门的定制化电路。”（maybe now people are thinking about like making their cooler kernels... instead of CUDA kernels, we'll just like make some custom circuits for every single thing we want.）

23:02 芯片的形式化：从AlphaProof到自动形式化

本节重点

提出了芯片设计的核心难题：如何将人类物理世界的设计意图，自动转化为数学证明所需的逻辑模型（自动形式化）。
借鉴AlphaProof证明数学猜想的经验，揭示了在证明生成与规格翻译任务上的巨大鸿沟。
探讨了在处理数千页芯片规格书时，如何通过多部门正交验证的古老技巧，以及AI代理的熵减来确保人类意图未被扭曲。

详细精要

AlphaProof模式的适用性差异：
芯片设计的正确性需要经历两步：第一步是自动形式化，也就是将人类文本规格翻译给类似于 Lean 这样的形式化证明器；第二步才是执行 AlphaProof 式的任务，即在代数的封闭世界中寻找证明。
现实中，AlphaProof 在证明阶段之所以能大规模训练，是因为它利用了一个精妙的取巧手段：即使将数学题翻译错了，也可以用这个逻辑上为假的题目去训练模型推翻它，这让证明阶段充满了天然的训练信号。
真正的瓶颈在于自动形式化。芯片规格书动辄数千页，任何一两个单词、一组数字的翻译错误，都会导致整个证明变得毫无实际意义。而人类语言中的模糊性（如“非负数”在Lean中的表达歧义），更是加剧了这种一对多映射的复杂性。
硬件领域的“正交隔离”信任机制：
工业界消解这种翻译与理解上的偏差，通常采用极为古典的团队正交性：A团队负责设计，B团队独立负责编写测试，C团队则聚焦于测试的“功能性覆盖率”审查。如果三个完全独立的团队对一份模糊的规格书得出了高度一致的解读，那么这种偏差往往就达到了可以接受的安全阈值。
将这种机制对应到AI代理领域时，存在一个“AI信任悖论”：即便用三个不同的代理会话去模拟A、B、C团队，它们依旧都是从同一个基础大模型中派生出来的，这种所谓的“正交”是否真正可靠？
对此，Thomas提出了长程运行的熵减论：虽然底模相同，但由于长期运行中引入了极高的随机种子噪音和环境熵，不同代理在不同时间尺度上跑出来的结论如果还能收敛一致，那么这种收敛本身就构成了极高置信度的间接验证。

💬 精华片段（中文）

“你只要哪怕有几处词语或者几个数字搞错了，那么你证明的东西就不再是重要或相关的了。”（if you got just a couple of words wrong somewhere or a couple of numbers, then it doesn't work. Like then what you prove is not important or is not relevant.）

35:00 热力学计算：当噪声成为计算本身

本节重点

深度解析了Normal Computing打造的 CN101 热力学芯片的基本物理原理，即直接利用电路的约翰逊噪声和高斯噪声来执行随机游走。
揭示了一个颠覆性的科学哲学应用：精心编程的电路阵列，其噪声实际上会自发地开始执行对矩阵的求逆运算。
指出了这类物理计算芯片在现代大模型不确定性估计和贝叶斯推理中面临的重重矛盾与实现挑战。

详细精要

从噪声抑制到噪声利用的范式跃迁：
在过去的几十年里，芯片制造业一直是世界上最追求极精密的行业，投入了难以想象的资金去消除芯片内部每一点细微的热噪声和电噪声。
然而，Normal Computing 却提出了一种激进的逆思维：与其引入伪随机数发生器然后耗费巨量算力去运行采样，为什么不直接造一颗本身就被物理噪声所支配的芯片呢？
他们通过控制电容与可编程电阻构成的网络，利用源源不断注入的噪声，让整个芯片的宏观状态自发地遵循一套随机微分方程。
物理世界中涌现的线性代数求逆：
这个充满噪声的系统表现出一个极其优美的数学特性：整个系统随机游走的统计稳态，竟然自然地对应着该电路网络中电导矩阵（即设定的权重矩阵）的逆矩阵。
这一发现为那些受限于矩阵求逆计算效率的算法（如高斯过程回归、马尔可夫链蒙特卡洛的核心采样步骤等）提供了一个颠覆性的物理捷径。过去需要庞大算力的数值运算，现在可以通过等待物理系统的自然弛豫来完成。
多模态推理时代的概率实用性迷思：
虽然贝叶斯概率论推崇用完整的概率分布来描述认知，但在当今的大模型领域，这种深度的量化遇到了巨大的逻辑断层。
对于单个Token的概率分布进行量化，在当下的多步推理和多轮回溯面前意义十分有限。人们不再关心单个词的置信度，而是关心模型通过长链反思后的最终结论是否可信。
要实现这种宏观的不确定性量化，要么沉入不可知的深层机制可解释性，要么利用更宏观、拟人化的心理评估。这使得精巧的物理概率芯片面临一种“屠龙之技”般的尴尬：它可以极快地算概率，但用户不知道在复杂的逻辑流中该把算出来的概率用在哪儿。

💬 精华片段（中文）

“芯片制造商花了那么多时间和金钱把每一丁点噪声都清除掉。而我们拿到芯片之后，又拼命地往里加随机数。” (they spend so much time like getting out every single little piece of noise out of their systems ... And then what do we do with them? We just like add randomness everywhere.)

42:03 深层解析：LLM生成与符号回归的边界

本节重点

讨论了类似马斯克提出的“让LLM直接生成二进制”的极端思维误区，以及计算机科学中固有的极限。
类比了国际象棋引擎的演进史，论证了在程序合成与芯片设计中，“LLM提供直觉”与“经典算法暴力搜索”相结合可能是最终归宿。
深入设想了一种嵌套式的设计哲学：人类构建模块，AI调用这些模块并编写胶水代码，以此维持系统的结构演化。

详细精要

LLM的二进制与底层逻辑缺陷：
对于是否能用LLM直接编写汇编或二进制代码，Thomas承认从理论上并非不可行，但大部分时间这将构成严重的计算资源浪费。
计算机科学中存在着一些根本性、不可撼动的底层效率问题，比如密码学或大数乘法，在这些领域，LLM因其固有的概率性和冗余性，效率根本无法与高度优化的确定性逻辑电路相匹敌。
因此，最理想的架构是将LLM作为一种直觉发射器，而将最终的编译、优化与验证，交还给由高速搜索算法构成的传统软件层。
国际象棋AI的混合架构启示：
这一逻辑在国际象棋的演进史上极为清晰：以 AlphaZero 为代表的纯神经网络方案曾风光无限，但如今最强的开源引擎却是像 Stockfish 这样的混合体。
Stockfish 的做法是将神经网络压缩为一个极快、极扁平的评估函数，然后将其无缝嵌入到一个极其狂暴的经典搜索框架中。它将“暴力计算”与“深度直觉”进行了物理级别的拆解与重组。
对于芯片综合与程序合成，很可能会诞生类似的范式：当一个由AI生成的设计面临巨大的搜索树和状态爆炸时，就必须无缝切换到更快上千万倍的传统算法，而不是继续让LLM慢悠悠地生成Token。
系统架构中的抽象“锚点”：
为了避免代码演变为不可维护的意大利面条，最关键的策略是内部化设计过程。AI不应只是在最后拿到一份孤立的规格文档，而应全程参与理解“为什么这个数字是5而不是6”。
通过让模型深入到初始设计意图中去，才能对代码的哪些部分是不可动摇的架构核心、哪些部分只是为了凑巧通过的胶水代码，产生清楚的认知。
这种方式类似于给高度不确定性的环境引入了抽象锚点。虽然无法避免暂时的局部黏合，但确保了随着迭代，系统总体的结构熵在降低，而不是无限扩张。

💬 精华片段（中文）

“你总是希望在某些时候切换到更经典的算法上去。”（at some point there's also just a hard commutation problem where you just want to brute force some stuff. And at that point, you want to be able to switch to more classical algorithm.）

56:50 智能的黑暗面：认知侵蚀、孤立与熵增

本节重点

尖锐指出由于AI的过度易用，人类用户正变得更懒惰，更深陷于一种对系统无知的“虚假理解”心流中。
探讨了AI冲击下的社会协作解体：从个人写作的社会契约，到代码仓库的贡献审核，再到团队内部具有深度的沟通交流，一切关于付出与协作的秩序都在被侵蚀。
思考了现代企业追求短平快“表现”与追求长周期、高难度的深层“能力”培育之间的极度张力，这被归结为资本主义环境下的必然冲突。

详细精要

虚假理解与认知代偿的恶性循环：
由于LLM能够极其顺滑地生成逻辑严密、书写优美的文本或代码，它会赋予用户一种错觉，即用户认为自己已经掌握了这些生成物的内在逻辑。这种AI引发的AI精神病会让用户坚信自己生成的是杰作，并趋于封闭和自我强化，拒绝接受外界专家的负面反馈。
这导致了一个理解侵蚀的螺旋：AI替代用户完成了脑力劳动中的认知摩擦，用户的大脑并没有经历处理难题时所需经历的神经元的物理放电与连接过程。
Karpathy式的体感学习法——即拒绝复制粘贴，强迫自己手动输入每一行代码——虽然表面看起来机械缓慢，却是一种捍卫生物神经网络自主演化的最后防线。
协作性制度与社会契约的崩解：
在过去，沟通存在一种不成文的社会契约：提交给他人阅读的成果（无论是论文还是拉取请求），必然意味着作者付出了十倍以上的创作与打磨时间。这种不对称的代价，是尊重协作时间的体现。
AI彻底打破了这种契约。现在开源社区被海量的“AI生成的PRs”淹没，维护者需要耗费大量精力去辨认那些作者本人甚至都没看过的垃圾提交。
解决这种社会层面的污染，业界开始诉诸某种类似GitHub信用评分/业力系统。低信用用户的自动机产出将被无视，但这又不可避免地产生了对新生代和圈外人士的排挤效应，构成了一种两难的社会悖论。
绩效重于好奇：资本闭环中的智力固化：
托马斯批判了一种源于马斯克式“公司只有工程师，没有研究者”的纯工程导向思维。这种思维过度追求让事物通过测试，而完全不在乎操作者在此过程中是否被剥夺了深刻的基础知识构建。
这种纯粹的绩效文化根植于资本主义的逐利本能。企业并没有必然的动机去深度培养员工，因为这不仅需要极高的沉没时间成本，且核心员工离职还会带来显性的经济损失。
因此，智能工具的普及非但没有拉平能力的差距，反而让善于理解底层的精英与满足于黑箱调用的普通使用者之间的认知鸿沟进一步指数级扩大。

💬 精华片段（中文）

“不仅仅是AI在变得越来越聪明，同样重要的是，人类在变得越来越愚蠢。我们不再了解事物的原理，我们对事物变得懒惰。”(...it's not just that it's getting smarter, it's also that humans are getting dumber, like we no longer like know and like we get get lazy in terms of understanding stuff.）

专业术语注释

术语	解释
Verilog（硬件描述语言）	一种用于描述电子电路结构和行为的超级并行编程语言。在播客中，它被看作是芯片设计的“编程语言”，工程师用文本形式编写逻辑，最终再烧录为刻死的实体硅片。
RTL (Register-Transfer Level)	寄存器传输级，是数字系统设计中面对时钟周期的行为抽象层级，通常直接用Verilog描述该级别的电路行为。
EDA工具 (Electronic Design Automation)	电子设计自动化工具。在播客中泛指昂贵的商业套件，用于逻辑仿真、综合、版图布局等，被视为芯片界的“重型工业软件”。
Netlist（网表）	将硬件描述语言编译后得到的，描述逻辑门之间具体连接关系的文件，是设计交由晶圆厂前后的核心枢纽。
Fab（晶圆制造厂）	指实际制造实体硅片的高精密工厂。播客中多次强调流片的极高成本，一次失败可能导致数亿至数十亿美元的损失。
形式化验证 (Formal Verification)	使用数学的方法证明系统设计满足某种绝对规格，不同于普通的仿真，它追求100%无遗漏的正确性，在硬件和数学中应用广泛。
自动形式化 (Autoformalization)	核心难题：将人类自然语言或文本规格书自动翻译为机器可以理解的数学定理。当前RL在证明阶段强，而在规格翻译阶段弱的关键根源。
Lean（证明助手）	一种基于依赖类型理论的形式化证明语言和验证器，也是AlphaProof用于证明国际数学奥林匹克题目的核心工具。
局部敏感哈希 (Locality Sensitive Hashing)	一种用于在大规模高维数据中进行快速相似度搜索的算法技术，是Thomas早期的研究专长。
马尔可夫链蒙特卡洛 (MCMC)	一类从复杂概率分布中采样的算法。播出中提到，在贝叶斯方法中，这在GPUs中因其固有的重复性和随机性约束而运行较慢。
随机微分方程 (Stochastic Differential Equations)	描述被随机噪声干扰的动态系统。在播出语境里用以形容热力学芯片的宏观状态，每一个微观粒子的无规热运动在电路宏观属性上整合成了方程。
适应性/持续学习 (Adaptivity / Continual Learning)	既有争议又关键的名词：描述一个不停止训练，一直吸收新数据并对架构导致参数变动的活体系统，而非冻结的静态模型。
SVA (SystemVerilog Assertions)	用于检查RTL级别电路信号在一个或多个周期中是否符合某些断言验证的工业主流语言。
TLA+ (Temporal Logic of Actions)	勒芒·兰伯特开发的用以严格描述并发系统，避免死锁、活锁等协议级层面抽象的形式化语言。
时间佩特里网 (Timed Petri Nets)	处理含有严格时间同步关系的普高并行状态变迁的形式化系统。播客中以其为例解释了常规DRAM在不同bank之间的复杂接口防死锁设计。
LoRA (Low-Rank Adaptation)	一种在预训练基座模型上插入并仅更新极小部分参数的低秩微调方法，用于在商业中变通实现“既可共用大模型，又能留存个人学习的记忆”。

延伸思考

混合智能架构的工程路径：未来十年，一个稳定且可验证的“混合理智”软硬件栈，是否将完全由“LLM生产胶水代码和直觉提案”而“经典确定论逻辑处理搜索与验证”所构成？这是否会让所有的全栈AI至下而上的方式沦为低效的摆设？
物理与数字世界的接口：热力学芯片将计算结果编码于物理实体的弛豫态中，这种先天的模糊性与采样误差，是否会因为随着数字监督体系（如基准测试审查）的严格化，而在工业级部署中被拒之门外，还是说我们需要重新定义机器输出“对与错”的物理界碑？
群体智力与熵减：“所有代理达成共识即为准确”的逻辑，是否最终会陷入同质化底模的“回声壁效应”？长此以往，由高度同质化数据迭代生成的系统，是否会因为丧失了外部知识输入而导致整个生态进入一种静态的、无法创新的“太一”状态？
人的退化与职场的重塑：当管理者甚至鼓励用“每人自己复制一份AI代码”的方式取代协作，我们是否正在用工程效率革了人类组织社会性复杂技能的命？一种不以“代码产出量”而以“抽象骨架与因果发现的洞察力”作为考核的逆向指标体系，是否会在企业生长出来？
贝叶斯概率的不落地争议：端到端的序列生成（链式思维）已经用海量浮点消除了中途统计的不确定性，物理学上的阵列概率加速器，是否还有机会在硅基大脑的逻辑层面，取代大模型生成过程中隐含的“人为干预式得分门控”？还是说物理概率只能作为深层机制解释的工具而存在？

原文发表：Jun 28, 2026 · 纪要生成：2026-06-29