来源: YouTube | Prof. Michael I. Jordan | May 20, 2026 分类: 其他 原文发表: May 20, 2026 纪要生成: 2026-06-29
迈克尔·乔丹 (Michael I. Jordan) 教授是加州大学伯克利分校的顶尖学者,曾被《自然》杂志评为最具影响力的计算机科学家之一。尽管通常被视为AI/机器学习领域的权威,乔丹教授本集却以批判者的姿态出现,强调自己的学术根基在于统计学、认知科学和运筹学。他指出,当前由大语言模型引发的AI热潮充斥着“伪知识分子”气息和误导性修辞,严重脱离了现实世界的经济规律和工程实践。本集深入探讨了他最新提出的“AI的集体主义经济学视角”,试图为AI的未来发展描绘一幅更务实、更注重人类社会福祉的蓝图。
本节重点
详细精要
“AGI”在他看来仅仅是一个公关术语,它扭曲了现实,迷惑了年轻人。它制造了“我们已到达终点,再无新事可为”的假象,这完全违背了科技服务的初衷。
【核心论点】个人学术背景与AI历史的割裂:
💬 精华片段(中文)
“AGI 这个术语对我来说,只是一点点... 它是一个公关术语。... 我认为它只会扭曲现实。我觉得它迷惑了年轻人... 今天我会稍微谈谈,我发现这些所谓的思想领袖最令人担忧的一点,就是他们在播客或其他场合中表现出的那种恐慌论调或狂热论调。”
“AGI to me is just a bit of it‘s a it’s a PR term. And it‘s some people think it’s fun because you have to have these great aspirations. I think it’s just distortionary. I think it confuses young people... the most alarming about the so called thought leaders... is the alarmist tone or the exuberant tone.”
本节重点
详细精要
当前的“创造者”只是在用贪婪的算法处理从互联网上窃取的数据,且不向数据的原始生产者返还任何价值。然后他们从“没有深度思考”的人那里获取巨额资金。这种脱离现实的水平在人类历史上是不寻常的。
【核心方法论】引入集体主义与经济学视角:
💬 精华片段(中文)
“整个事件中让我最感困扰的一点是,其中完全没有经济思维... 当前这代从业者没有多少思考,没有多少‘知识分子’的东西。他们只是在说:‘是的,这可以建造出来。是的,你可以从任何你想偷的地方偷数据,因为互联网允许这种情况发生,并且不向数据的原始创造者返还任何价值。你可以在这上面运行贪婪的优化算法,但这需要大量资金,而这些钱现在可以从那些不进行深度思考的人那里获得。'”
“The second part that bothers me is there‘s no economic thinking going on there... The current generation is just way too... there’s not much thought going on, not much intellectual stuff. It's just, yeah, it’s possible to build it, it’s possible to steal the data from wherever you want to because that‘s what the Internet allowed to happen and not return any value to the person who originated the data. It’s possible to run greedy descent on that but you need huge amounts of money but it’s now possible to get it from people who aren‘t thinking very deeply.“
本节重点
详细精要
用户需要的是可执行的信息。例如,系统可以告诉他:”根据我们的嵌入模型,这里有50个和你很像的人。其中一些人拿到了贷款,一些人没有。让我展示一下那些拿到贷款的人和你有什么不同。“ 这使得用户能够理解并根据差异做出改变。
【核心案例】AlphaFold的偏差与纠正:
💬 精华片段(中文)
“科学家很少仅仅对重温过去感兴趣。他们感兴趣的是知识边缘上的全新事物。而正是在这一点上,这些基础模型的表现会是最差、偏差最大的。... 围绕任何一个基础模型,都需要有一种能力,即可以收集一点真实数据,用像这样的程序将其合并进去,然后给出一个更可信的答案。”
“scientists are rarely interested in just studying the past over again. They‘re interested in brand new things on the edge of knowledge. And that’s where specifically these foundation models will be most poor and most highly biased. So there needs to be around any foundation model the ability to maybe collect a bit of ground truth data to merge it in with some procedure like this and then to give out a more trustable answer.”
本节重点
详细精要
当第三方参与进来后,原有的均衡被打破。用户失去了部分隐私,因为他们不知道自己的数据流向了何方。
【核心机制】通过市场机制调节隐私与经济价值:
💬 精华片段(中文)
“现在你可以看到这里有冲突的趋势。这些激励措施是相互关联的,但并非对每个人都是最佳的。所以,现在的数学问题不再只是一个优化问题,而是一个均衡问题。但这个均衡问题涉及统计断言、数据,以及用这些数据你能做多好的预测... 你把所有这些放入一个大的数学系统中,就可以找到作为各种系统参数函数的均衡点。”
“And so now you can see there‘s conflicting tendencies here. The incentives are aligned but they’re not optimal for everybody. And so now the mathematics is not just an optimization problem, mathematics is an equilibrium problem. But it‘s an equilibrium problem that involves statistical assertions, data and how much you can predict with this data... So you put that all together in a big mathematical system and you can find the equilibrium as a function of various system parameters.”
本节重点
详细精要
拍卖理论是机制设计的一种,其目标是设计一种机制,让最渴望得到某样物品的人最终能得到它。而契约理论则是机制设计中处理“信息不对称”的场景,即一方知道的比另一方多,双方仍需达成合作。
【核心连接】统计契约理论与E值:
💬 精华片段(中文)
“博弈论是一个极其丰富、历史并不算悠久的学科,如今已有100年了,它仍在不断演化,并持续为我们这些从业者提供各种各样的算法思想... 机制设计说的是,‘哦,我想要的世界上出现某种结果,比如某人得到报酬,财富被公平分配,或者创造出某种市场。那么我应该设计一个什么样的博弈,才能让这个结果得以实现?’ 所以我是这个游戏的设计师。”
“Game theory is a super rich, not so old discipline, you know, 100 years now, that’s that‘s continuing to evolve and continue to supply all kinds of algorithmic ideas... Mechanism design says, ’oh, I want a certain outcome in the world that that person gets paid, that the wealth is divided equally, that there‘s some fairness or some market that’s created. What game do I design so that that outcome is realized?‘ So I’m the designer of the game.”
本节重点
详细精要
即使嫁接一些方法(如保形预测)进去,也依然存在可交换性等严格的假设前提。乔丹教授更倾向于思考更大的上下文背景。
【核心分类】三种不确定性模型:
对LLM的最终诊断:LLM在这三种不确定性上全部缺失。它没有“数据太旧,我应该打折扣”的溯源概念,没有“这是个社会环境,我应该随机化我的决定”的博弈概念,也没有“我需要在‘不确定性上’,进行主动的 认识性觅食”的统计学意识。它只是在网上见到过人问“你有多大把握”,然后复述人类关于把握度的言论罢了。
【核心洞察】市场作为不确定性降低的引擎:
💬 精华片段(中文)
“可怜的大语言模型几乎在上面所有这些方面都交了白卷... 人类非常擅长处理这些,一点点‘溯源’(哦,这是旧数据,我打个折扣),一点点‘情境’(哦,这有个社会环境,我应该随机化),一点点‘采样不确定性’等等。我们把所有这些几乎无缝地组合在一起... 然后,大语言模型当被问到‘你有多大把握'时,它能说什么呢?据我所知,它只是在模仿网上那些人类关于把握度的断言,那可不是在不确定性下进行推理。”
“So the poor LLM has none of the above... We are pretty good at getting these, with a little bit of providence (Oh, it’s old data, I discount that). We get a little bit of context (Oh, there‘s a social environment here, I should randomize). Oh, there’s some sampling uncertainty and so on. We put all that together almost seamlessly... So what should it say when you ask how sure are you? And all it‘s doing to the best of my knowledge is that it’s just... it just mimics that those kind of assertions, but that‘s not reasoning under uncertainty.”
| 术语 | 解释 |
|---|---|
| 人工智能 (Artificial Intelligence - AI) | 乔丹教授认为这个在20世纪50年代提出的术语具有误导性,其原始目标(如逻辑推理)未成功,当前的复兴是公关和语言模型带来的扭曲。 |
| 通用人工智能 (Artificial General Intelligence - AGI) | 在本集中被批判为纯粹的公关术语 (PR term),转移了研究人员的注意力,并将公众的讨论引向乌托邦或反乌托邦的歧途。 |
| 机器学习 (Machine Learning) | 乔丹教授更认同的学术传统。诞生于统计学和运筹学,通过决策树、逻辑回归等方法,在供应链、交通、电子商务等领域取得了巨大工业成功的务实技术。 |
| 大语言模型 (Large Language Models - LLMs) | 仅是机器学习传统中的一个最新发展,其能力令人惊叹但被过度神化。其核心问题在于缺乏不确定性量化、经济思考和行为体意识。 |
| 集体主义经济学视角 (Collectivist Economic Perspective) | 乔丹教授提出的核心框架。认为AI系统的基础是来自数十亿人的数据,最终也服务于数十亿人,因此必须用经济学的激励、均衡等思维来设计和治理。 |
| 预测驱动的推断 (Prediction-Powered Inference - PPI) | 乔丹教授团队提出的一种统计学方法。通过结合大量但可能有偏差的预测数据和少量真实数据,来构建能覆盖真实值的置信区间,使模型结果更可信。 |
| 机制设计 (Mechanism Design) | 博弈论的“逆问题”。不是给定游戏规则预测结果,而是从一个期望的社会结果(如公平、效率)出发,逆向设计游戏规则(机制)。 |
| 契约理论 (Contract Theory) | 机制设计的一个分支,专门处理存在信息不对称(一方比另一方知道得更多)时,设计最优的激励机制或合同。 |
| E值 (E-value) | 现代统计学中的一个核心概念,源自博弈论概率。它是非负随机变量的期望,可以为数据证据的强度提供一个随时间积累的量度,支持在任何时候停止实验并得出结论。 |
| 保形预测 (Conformal Prediction) | 一种为任意机器学习模型提供不确定性的技术,可以在不依赖严格分布假设的情况下,构建预测区间或集合。 |
| 溯源 (Providence) | 在乔丹教授的语境下,指数据来源的“出身”和“历史”信息,如数据是何时、何地、在何种上下文下被收集的,这种信息对量化不确定性至关重要。 |
| 三层数据市场 (Three-Layer Data Market) | 乔丹教授提出的一个极简模型,由用户、平台和数据买家三层构成,用以研究数据价值、个人隐私和经济激励之间的复杂均衡关系。 |
| 纳什均衡 (Nash Equilibrium) | 博弈论的核心概念,指在一个策略组合中,没有任何一个参与者可以通过单方面改变自己的策略而获得更好的收益。 |
| 信息不对称 (Information Asymmetry) | 交易或互动中一方拥有另一方不知道的信息。这是经济学和契约理论关注的核心问题之一。 |
| 认识性觅食 (Epistemic Foraging) | 指像动物觅食一样,在信息世界中主动寻找知识以降低对特定领域的不确定性的行为过程。 |