▶ 原文链接

斯坦福AI俱乐部访谈:Jason Wei谈2025年AI领域的3个核心理念

来源: YouTube | Jason Wei | 2025年10月17日 分类: 其他 原文发表: Oct 17, 2025 纪要生成: 2026-03-03


全集重点


嘉宾/话题简介

Jason Wei现任Meta超级智能实验室研究科学家,曾任职OpenAI、谷歌大脑,是思维链提示指令微调、01模型、深度研究等核心AI技术的共同发明人,论文累计引用量超9万,是当代最具影响力的AI研究者之一。本次分享他针对2025年AI发展提出三个基础认知框架,帮助听众理解AI发展规律、预判产业影响,消除对AI替代的极端认知偏差。分享时长约30分钟,结束后开放自由问答。


分节详述

00:00 开场及分享框架介绍

本节重点 - 主持人介绍Jason Wei的职业背景与核心研究成果 - Jason Wei明确本次分享将围绕2025年AI的3个基础认知展开 - 点明当前大众对AI发展影响的认知存在极大两极分化

详细精要

💬 精华片段(中文)

"So I think if you ask this question of like how our world is going to change with the development of AI, you get sort of this like pretty broad spectrum of answers depending on who you ask."


01:00 核心理念一:智能成为大宗商品

本节重点 - AI能力发展分为突破前沿和商品化两个阶段,成熟能力的使用成本逐年快速下降 - 自适应计算技术的落地是智能成本持续下降的核心支撑 - 公共信息获取速度随技术迭代指数级提升,多个过去高门槛领域将被民主化 - 公共信息价值下降,私有内幕信息的相对价值大幅提升

详细精要

💬 精华片段(中文)

"Once we sort of achieved abilities with AI, the cost of it will be driven towards zero. I think the trend will continue."


10:27 核心理念二:验证不对称性与验证者定律

本节重点 - 任务的生成难度和验证难度存在不对称性,不同任务的不对称方向差异极大 - 验证者定律指出AI训练某项任务的能力和任务的易验证性成正比,易验证的任务终将被AI攻克 - 可通过预设测试集等方式提升任务的验证便利性,加速AI在该领域的突破 - DeepMind的AlphaEvolve是利用验证不对称性实现任务突破的典型案例

详细精要

💬 精华片段(中文)

"But basically the claim that I'd like to assert is that the ability to train AI to solve a task is uh basically proportional to how easily verifiable the task is."


18:57 核心理念三:智能的锯齿边缘

本节重点 - AI不会出现爆发式的通用智能起飞(fast takeoff),不同任务的能力和迭代速度存在极大差异 - 当前不同区域人群对AI影响的认知偏差,本质是未意识到智能的锯齿边缘特征 - 可通过三个核心特征预判AI在特定任务上的发展速度 - 数字化、数据丰富的领域将最先被AI渗透,非数字化、低数据的领域受AI影响极小

详细精要

💬 精华片段(中文)

"I don't think there will be a sort of fast super intelligence takeoff because, um, every sort of task has a different capability and rate of improvement."


28:57 总结与收尾

本节重点 - Jason Wei再次汇总本次分享的三个核心理念 - 开放反馈渠道,欢迎听众通过Twitter互动

详细精要

💬 精华片段(中文)

"Okay great. So in summary, intelligence and knowledge will become fast and cheap. Number two, verifiers law, measurement is a driving factor of AI progress. And then finally, the edge of intelligence is jagged."


专业术语注释

术语 解释
MMLU(英文) 本集中指大规模多任务语言理解基准,是目前评估大模型通用知识能力的最主流行业基准
自适应计算(Adaptive Compute) 本集中指大模型可根据任务难度动态调整推理阶段算力消耗的技术,简单任务消耗少算力,复杂任务消耗多算力,可大幅降低智能调用成本
01模型(英文) OpenAI推出的大模型产品,首次证明了推理阶段自适应调整算力可大幅提升数学等复杂任务的性能
深度研究(Deep Research) OpenAI推出的大模型功能,可通过多步推理、检索完成复杂的信息查询和问题解决,在BrowseComp基准上可解决50%人类2小时无法完成的任务
BrowseComp(英文) OpenAI推出的浏览能力基准测试,包含大量需要多步检索、跨源验证的复杂信息查询问题,用于评估大模型的网络信息检索能力
Kosis(英文) 韩国官方统计数据库,本集中提到的查询1983年釜山结婚人数需要访问的数据源
思维链提示(Chain-of-Thought Prompting) 大模型提示工程技术,通过引导大模型输出推理过程,大幅提升大模型解决复杂逻辑、数学任务的能力,是Jason Wei在谷歌大脑期间的标志性成果
指令微调(Instruction Tuning) 大模型对齐技术,通过在各类指令遵循数据集上微调,提升大模型理解人类指令、输出符合人类需求结果的能力,是Jason Wei在谷歌大脑期间的核心成果之一
验证者定律(Verifier's Law) 本集中Jason Wei提出的AI发展规律,指训练AI完成某项任务的能力与该任务的易验证程度成正比
SWE-bench(英文) 评估大模型软件工程能力的主流基准,给每个代码任务提供预设的测试用例,可自动验证代码解决方案的正确性
AlphaEvolve(英文) DeepMind推出的AI算法,利用验证不对称性,通过多轮采样-验证-迭代的方式,攻克了多个数学和算力优化类复杂任务
快起飞(Fast Takeoff) AI对齐领域的经典假说,指AI一旦具备自我改进能力,就会在极短时间内实现能力指数级跃升,全面超越人类
Flingit(英文) 仅几百名美洲原住民使用的小众语言,目前大模型对该语言的理解能力极差
AlphaZero(英文) DeepMind推出的强化学习算法,无需人类训练数据,仅通过规则自我对弈生成合成数据,就攻克了围棋、国际象棋等棋类任务

延伸思考

  1. 企业可优先梳理内部可量化、数字化、数据充足的业务环节,优先落地AI实现效率提升,暂时避开非标准化、难验证的场景,降低AI改造的试错成本。
  2. 个人职业规划可优先向需要强社交互动、物理世界操作、私有信息积累的方向倾斜,避开易验证、标准化的数字化任务赛道,降低被AI替代的风险。
  3. 创业机会可聚焦“AI验证工具”赛道,为各行业提供可自动化、可批量执行的任务评估指标,即可依托验证者定律享受AI产业的发展红利。
  4. 无需过度恐慌通用AI的突然替代,可基于“数字化程度、人类难度、数据丰富度”三个维度定期评估所在领域的AI渗透进度,提前做好技能储备即可。
  5. 未来信息资产的价值将进一步分化,公共信息的溢价趋近于零,独家私有数据(如未公开的行业数据、用户行为数据)的商业价值将持续提升。

原文发表:Oct 17, 2025  ·  纪要生成:2026-03-03