▶ 原文链接

Andrej Karpathy:从“氛围编程”到“智能体工程”

来源: YouTube | Andrej Karpathy | Apr 29, 2026 分类: 其他 原文发表: Apr 29, 2026 纪要生成: 2026-05-26


全集重点


嘉宾/话题简介

Andrej Karpathy 是人工智能领域的杰出人物,曾作为联合创始人之一在 OpenAI 办公室内参与创建了 OpenAI,并曾在特斯拉主导 Autopilot 系统的研发工作。他因擅长以通俗易懂的方式解释复杂的技术变迁而闻名,是“软件 2.0”理念的提出者。去年,他创造了 “氛围编程” 一词,深刻影响了开发者社区对 AI 辅助编程的认知。

本集节目中,Karpathy 深入阐述了他近期关于 AI 发展的核心思考。他从自己在编程中感到的“前所未有的落后”这一惊人感受出发,系统地拆解了 “软件 3.0” 范式、“可验证性” 与模型 “锯齿状智能” 的根源,并定义了从 “氛围编程”“智能体工程” 的演进,最终落脚于 AI 时代人类理解力与教育的终极价值。


分节详述

00:00 从“感到落后”到“氛围编程”:一个编程转折点

本节重点

详细精要

💬 精华片段(中文)

“我记不起上一次纠正它是什么时候了。然后我就越来越信任这个系统……我那时就是在进行‘氛围编程’。”

"I can't remember the last time I corrected it. And then I was I just uh, you know, trusted the system more and more. And then I was vibe coding."


02:35 软件 3.0:将 LLM 视为一种新型计算机

本节重点

详细精要

💬 精华片段(中文)

“整个 MenuGen 都是多余的……软件 3.0 范式要原始得多。你的神经网络做了越来越多的工作,你的提示或上下文就只是一张图,输出也是一张图,中间根本不需要任何 app。”

“All of my menu gen is spurious...the software 3.0 paradigm is a lot more kind of raw. It just um, your neural network is doing more and more of the work, and your prompt or context is just the image, and the output is an image, and there's no need to have any of the app in between.”


07:48 2026年的新机会:“神经网络优先”的原生应用

本节重点

详细精要

💬 精华片段(中文)

“在计算的早期,人们对于计算机是看起来像计算器还是像神经网络感到有点困惑……我们最终走了计算器的路径……但可以想象,很多东西会翻转过来,神经网络成为宿主进程,而 CPU 成为协处理器。”

“In the early days of computing actually, people were a little bit confused as to whether computers would look like calculators or computers would look like neural nets...we went down the calculator path...But you could imagine I think that a lot of this will flip and that the neural net becomes kind of like the host process. And the CPUs become kind of like the co-processor.”


09:53 “可验证性”之谜:为何AI能力如此“锯齿状”

本节重点

详细精要

💬 精华片段(中文)

“当前最先进的 Opus 4.7 能同时重构一个十万行的代码库,或者找到零日漏洞,但却告诉我要走路去洗车?这太疯狂了。”

“State-of-the-art Opus 4.7 will simultaneously refactor a 100,000 line code base or find zero-day vulnerabilities and yet tells me to walk to this car wash? This is insane.”


13:30 对 AI 时代创始人的建议:寻找可验证的领域

本节重点

详细精要


15:35 “氛围编程” vs. “智能体工程”:一场从“地板”到“天花板”的革命

本节重点

详细精要

💬 精华片段(中文)

“氛围编程是为了提高每个人的能力下限……而智能体工程则是为了保持专业软件原有的质量标准。”

“Vibe coding is about raising the floor for everyone... agentic engineering is about preserving the quality bar of what existed before in professional software.”


19:42 人类价值的新核心:品味、判断与顶层设计

本节重点

详细精要


22:15 AI 会发展出“品味”吗?代码审美的RL难题

本节重点

详细精要

💬 精华片段(中文)

“我试着不断地提示 LLM 去简化,再简化,但它就是做不到。感觉你完全处在 RL 的回路之外。”

“I tried to keep prompting an LLM to simplify more, simplify more, and it just can't. You feel like you're outside of the RL circuits.”


23:47 “动物 vs. 幽灵”:一种理解 AI 本质的框架

本节重点

详细精要


25:19 迈向“智能体原生”世界:传感器、执行器与新型基础设施

本节重点

详细精要


27:57 教育的未来:为何“理解”无法外包

本节重点

详细精要

💬 精华片段(中文)

“你可以外包你的思考,但无法外包你的理解。……LLM 绝对不擅长理解。你仍然独一无二地对此负有责任。”

"You can outsource your thinking, but you can't outsource your understanding... the LLMs certainly don't excel at understanding. You still are uniquely in charge of that."


专业术语注释

术语 解释
氛围编程 由 Karpathy 提出的概念,指一种对 AI 编程工具极度信任且无需过多人工检查和修改的状态。用户输入需求,AI 直接产出可信、可用的代码。
智能体工程 一门新兴的工程学科,专注于如何高效、安全地协调多个能力强大但存在随机性和缺陷的 AI 智能体,以在保证软件质量和安全的前提下实现极致的开发速度。
软件 1.0 / 2.0 / 3.0 Karpathy 定义的软件编程范式演进。1.0 指人工编写显式规则;2.0 指通过设计数据集和神经网络结构来训练模型;3.0 指通过向 LLM 提供提示和上下文窗口来编程,将 LLM 本身视为一个可编程的解释器。
LLM 大型语言模型。本集中尤指像 GPT-4 这样,通过海量互联网数据预训练和强化学习微调得到的,能理解和生成文本、代码等内容的巨型神经网络。
RL / 强化学习 一种机器学习训练范式,智能体通过与环境互动,根据获得的“奖励”信号(正或负)来学习何种行为能最大化累积奖励。在 LLM 中用于在可验证的领域(如数学、代码)上对齐和增强模型能力。
锯齿状智能 描述当前顶尖 AI 模型能力分布不均的现象。模型在某些高难度、可验证的任务(如竞赛数学、大型代码重构)上表现得像专家或超人,但在其他显而易见的简单常识任务上却犯低级错误。
可验证性 指一个任务或领域的输出结果是否能被一个自动化的、客观的标准进行评估。Karpathy 认为,当前 LLM 的训练范式决定了它们擅长自动化一切能被验证的事情,这是其能力“锯齿状”的根源。
预训练 在大规模、多样化的未标注或互联网文本数据上训练基础模型的第一步,目标是让模型学习语言的统计规律、世界知识和推理模式。这是模型“智能”的基石。
Nano Banana / Gemini 分别代表先进的图像生成/编辑模型和谷歌的旗舰多模态大语言模型。用来举例说明软件 3.0 范式下,复杂的图像处理任务可以被简化为一句话的指令。
传感器 / 执行器 控制论术语。Karpathy 借此比喻智能体原生世界的架构:LLM 作为核心处理器,通过“传感器”来感知世界信息(如读取文档、API),通过“执行器”来采取行动(如调用工具、修改代码)。

原文发表:Apr 29, 2026  ·  纪要生成:2026-05-26