▶ 原文链接

当 AI 发现下一个 Transformer 架构 — Robert Lange

来源: YouTube (MLST) | Robert Lange | Mar 13, 2026 分类: 其他 原文发表: Mar 13, 2026 纪要生成: 2026-06-29


全集重点


嘉宾/话题简介

Robert Lange 是日本 AI 初创公司 Sakana AI 的创始研究员之一。Sakana AI 致力于探索以 Kenneth Stanley 的“开放式结局”思想为核心的新颖研究路径,并专注于日本市场。Lange 的 PhD 研究深受 Sakana 联合创始人 David Ha 在超网络和进化优化方面工作的影响。在本集中,Lange 深入探讨了其最新论文 Shinka Evolve(进化进化),这是一种利用大语言模型和进化算法以极高效率进行程序发现和优化的系统,并将其与 AlphaEvolveJeremy Howard 的 ARC 解决方案,以及 Sakana 的 AI 科学家 项目进行了比较和展望。


分节详述

[00:00] 引言:进化、创新与 AI 的局限

本节重点

详细精要

💬 精华片段(中文)

"Oftentimes innovation for a specific problem might require first inventing a different problem..."

“针对特定问题的创新往往需要首先发明一个不同的问题……”


[02:07] Sakana AI 与进化哲学

本节重点

详细精要


[03:43] Shinka Evolve 简介:一个更高效的进化系统

本节重点

详细精要

💬 精华片段(中文)

"What we try to do with Shinka Evolve was try to essentially cut down costs as well as sort of computation evaluation time... we showed that it's possible with very few program evaluations to basically improve upon, like, example, the circle packing canonical result..."

“我们尝试通过 Shinka Evolve 去做的是,从根本上削减成本以及计算评估时间……我们证明了,用极少数的程序评估,就可能改进……圆形填充的典范结果。”


[05:21] 进化、踏脚石和 LLM 的局限性

本节重点

详细精要

💬 精华片段(中文)

"Oftentimes, innovation for a specific problem might require first inventing a different problem... automatically coming up with this reduction or like this, let's say, recursive nature of problem solving is something these systems right now not necessarily have built in intrinsically."

“针对特定问题的创新往往需要首先发明一个不同的问题……自动想出这种问题规约,或者说这种递归性质的问题解决方法,是当前这些系统在本质上不一定内置的能力。”


[09:03] 未知的未知与设计偏差

本节重点

详细精要


[13:48] 算法设计与元学习中的权衡

本节重点

详细精要


[14:22] Shinka Evolve 的技术创新:群岛与自适应模型选择

本节重点

详细精要

💬 精华片段(中文)

"It's not clear if the performance gain you get from the second mutation actually originated from GPT 5... or from Sonnet 4.5."

“你从第二次突变中获得的性能提升,究竟是源自 GPT 5……还是源自 SONNET 4.5,这一点是根本不清楚的。”


[17:00] 全局洞察与语义理解

本节重点

详细精要


[27:06] 软件范式变迁与 LLM 黑箱

本节重点

详细精要


[37:50] 验证瓶颈与内在规律

本节重点

详细精要


[40:02] 适应性、冻结模型与 ARC 挑战

本节重点

详细精要

💬 精华片段(中文)

"We are having our cake and eating it... We can build systems like Shinka Evolve that leverage the best of both worlds. They leverage frozen foundation models, but they give you adaptivity."

“我们在鱼与熊掌兼得……我们可以构建像 Shinka Evolve 这样的系统,它们利用了两边的精华。它们利用冻结的基础模型,但赋予了系统适应性。”


[46:08] AI 对劳动力市场与社会的影响

本节重点

详细精要


[46:50] Shinka Evolve 的多领域应用

本节重点

详细精要


[52:12] AI 科学家 v2 与科学发现的未来

本节重点

详细精要

💬 精华片段(中文)

"We're at the GPT-1 moment of making this sort of a reality... The paper writing part is actually the least important about the AI Scientist... It's a form factor that we humans are sort of used to."

“我们正处于将这种愿景变为现实的 GPT-1 时刻……对 AI 科学家而言,论文写作部分实际是最不重要的……它只是一个我们人类所习惯的形态因素。”


专业术语注释

术语 解释
Shinka Evolve (进化进化)Robert Lange 的论文,一个结合了LLM和进化算法、以极高样本效率进行程序发现和优化的系统。
Sakana AI 一家位于日本的AI创业公司,由David Ha等人创立,研究方向基于“开放式结局”的探索性想法。
Open-Endedness 开放式结局,由Ken Stanley提出的概念,即设计不设定最终目标的探索过程,通过积累多样化的“踏脚石”来产生伟大的创新。
Stepping Stones 踏脚石,指在最终达到伟大创新之前,所必须积累的一系列看似无关或低价值的中间步骤或发现。
AlphaEvolve Google DeepMind的项目,使用LLM和进化算法发现和优化算法,是Shinka Evolve的灵感来源之一。
Circle Packing 圆形填充问题,一个经典的优化问题,目标是在一个正方形内放入若干个圆,使圆的半径之和最大化,且圆之间不重叠。
Sample Efficiency 样本效率,在本文中指在进化搜索中,达成目标性能所需的生成和评估程序的总次数。效率越高,所需的计算和时间成本越低。
UCB (Upper Confidence Bound) 上置信界算法,一种用于解决多臂老虎机(探索-利用权衡)问题的算法,在Shinka Evolve中被用来动态选择最适合当前程序进行突变的前沿LLM。
Crossover 交叉,进化算法中的一种操作,通过结合两个“父母”程序的特性来产生新的“后代”程序。
Diffusion of Knowledge 知识扩散,在Shinka Evolve的树状搜索中,指将一个程序获得的正面经验(通过“草稿本”和“元建议”)分享给种群中其他程序的过程。
Problem Problem “问题”问题,指当前AI发现系统的一个核心局限:它们只能解决被给出的固定问题,而无法像人类一样为了达成某个目标而自主发明新的、中间的、或替代性的问题。
POET (Paired Open-Ended Trailblazer) 一种由Jeff Clune等人提出的算法,创造了一个环境和智能体共同进化的生态系统,两者相互“复杂化”,形成一个自动课程。
ARC-AGI Abstraction and Reasoning Corpus,由François Chollet设计的衡量AGI智能的基准测试,要求AI从极少的示例中学习抽象规则,极度考验对新问题的泛化能力。
Design Bias 设计偏差,指系统设计者预先设定的规则和结构对系统所能探索和发现的结果空间产生的内在限制。
Meta-Learning 元学习,又名“学会学习”,指设计模型使其能够通过经验来改进自身的学习算法或进行快速适应的机器学习范式。
Inductive Bias 归纳偏置,指学习算法为能从有限样本中泛化所做的一组假设。更强的偏置可以带来更快的收敛,但可能限制最终发现的多样性。
AI Scientist Sakana AI的项目,旨在创建一个能够全自动进行科学研究(从产生想法、执行实验、到撰写论文)的AI智能体系统。v2版本引入了智能体树搜索。
Slop 网络用语,原指低质量的AI生成内容。在本集中,特指那些“表面上看起来像科学论文”,但实际上缺乏深度、可验证的科学洞察和原理性发现的产出。
Rubicon Moment 卢比孔时刻,指越过之后就再也无法回头的关键点。这里指AI自主发现了类似“新的Transformer架构”这种划时代的重大创新,引发范式转移的时刻。

延伸思考

  1. “验证瓶颈”与数学的“自我验证”:Lange提到验证是核心难题。那么在数学和形式逻辑等领域,验证是绝对和确定的。由AI驱动的进化系统,在Pure Math领域的闭环中,是否会因为拥有“绝对真理”的验证器,而最先达成重大突破?
  2. 从“寻找答案”到“照亮帕累托前沿”的范式转变:Shinka在MoE损失函数设计中不仅找到最优,还照亮了探索空间。这是否意味着科学工具的终极形态不是提供“答案”,而是提供一张高维的“可能性地图”,将最终的权衡决断权交还给人类专家?
  3. “设计偏差”的悖论:Lange一方面承认人类设计的起点会带来设计偏差,另一方面又倡导像POET一样的系统。如果POET的环境生成器本身也是由人类设计的,我们是否只是在制造一个永远无法摆脱自身影子的递归循环?是否存在一种元算法,可以让系统自主修改自己的“环境生成规则”或“目标函数”?
  4. 专业知识的价值体现在新范式中:当一个“非专家”可以用自然语言启动像Shinka Evolve这样的黑箱系统解决一个他完全不懂的工程问题时,他算“解决”了这个问题吗?当解决方案是一个人类专家无法理解的黑箱时,我们如何评估其安全性、鲁棒性和潜在的伦理风险?
  5. 经济激励与人类的定位:Lange展望了一个全民参与、分布式解决问题、自动发现“踏脚石”的未来。在这种未来中,人类的核心价值和对应的经济激励模式将是什么?是“提供有远见的初始prompt”,还是“评估AI产出的美感和直觉”,亦或是某种我们现在还无法定义的新工种?

原文发表:Mar 13, 2026  ·  纪要生成:2026-06-29