▶ 原文链接
Lex Fridman播客第494期:黄仁勋(Jensen Huang)独家深度访谈
来源: Lex Fridman Podcast | 黄仁勋(Jensen Huang,NVIDIA创始人兼CEO) | 2026年3月23日
分类: NVIDIA
原文发表: Mar 23, 2026
纪要生成: 2026-04-20
全集重点
- 极端协同设计是NVIDIA当前核心战略:打破芯片级设计局限,从硬件、软件到数据中心全栈优化,实现远超线性的算力增长。
- CUDA装机量是NVIDIA最大护城河:依托20年生态积累、开发者信任与持续迭代,新竞品难以撼动其市场地位。
- AI四大缩放定律长期有效:预训练、后训练、测试时间、智能体四大缩放逻辑下,算力将成为AI能力提升的核心约束,而非数据。
- AI不会替代工作,而是重构工作范式:编程将从写代码转向需求定义,所有职业都将因AI工具实现能力升级。
- 领导力核心是共识塑造而非顶层命令:通过长期渐进的认知同步,让全公司、全供应链甚至全行业达成对未来的共识,降低战略落地阻力。
嘉宾/话题简介
黄仁勋是NVIDIA创始人兼CEO,被视为推动全球AI革命的核心人物之一,主导了CUDA生态、GPU算力架构等多项颠覆性创新,带领NVIDIA成为当前全球市值最高的科技公司之一。本次访谈是近年黄仁勋公开发言中信息密度最高的内容之一,系统覆盖了NVIDIA的全栈协同设计战略、企业管理哲学、AI行业未来趋势,也回应了供应链、中国市场、AGI、职业焦虑等大众关注的热点问题,对理解全球AI产业发展逻辑具有极高参考价值。
分节详述
00:00 开场介绍
本节重点
- 本次访谈为Lex Fridman播客第494期,嘉宾为NVIDIA CEO黄仁勋
- 访谈覆盖技术战略、企业管理、行业趋势、个人哲学等多维度话题
- 字幕为人工生成,可能存在误差
详细精要
- 嘉宾身份与访谈价值说明:Lex开场明确NVIDIA是驱动AI革命的核心引擎,其成功很大程度上归功于黄仁勋的个人意志与战略决策。
- 黄仁勋是少有的同时兼具工程师、创新者、领导者身份的科技大佬,本次访谈将围绕他的决策逻辑与行业判断展开。
- 播客时间戳可直接跳转至对应视频片段,方便用户定位内容。
💬 精华片段(中文)
接下来的对话嘉宾是黄仁勋,NVIDIA的CEO——NVIDIA是人类文明历史上最重要、最具影响力的公司之一,是驱动AI革命的引擎,其成功很大程度上直接归功于黄仁勋的强大意志,以及他作为领导者、工程师、创新者做出的诸多卓越押注与决策。
"The following is a conversation with Jensen Huang, CEO of NVIDIA, one of the most important and influential companies in the history of human civilization. NVIDIA is the engine powering the AI revolution, and a lot of its success can be directly attributed to Jensen’s sheer force of will and his many brilliant bets and decisions as a leader, engineer, and innovator."
00:33 极端协同设计与机架级工程
本节重点
- NVIDIA的竞争核心已从单GPU设计转向全栈极端协同设计
- 协同设计的核心目标是实现算力的超线性增长,突破阿姆达尔定律限制
- 摩尔定律与登纳德缩放放缓是推动全栈设计的核心背景
详细精要
- 极端协同设计的必要性:当前AI任务无法被单个GPU加速,要实现加入1万台设备后获得百万倍算力提升,必须拆分算法、分片流水线、数据与模型,分布式部署。
- 阿姆达尔定律限制了单组件加速的收益:若计算仅占总工作负载的50%,即便计算加速百万倍,总工作负载仅能提升2倍,因此必须从全链路优化。
- 摩尔定律与登纳德缩放已大幅放缓,仅靠芯片工艺升级无法满足算力增长需求,必须通过全栈协同突破瓶颈。
- 极端协同设计的覆盖范围:涵盖GPU、CPU、内存、网络、存储、电源散热、软件、机架、Pod乃至整个数据中心的全链路设计。
- 分布式计算规模下,CPU、GPU、网络、交换机、工作负载调度等所有环节都会成为瓶颈,必须统筹优化。
- 协同设计的目标是打破“加多少设备就提多少算力”的线性增长限制,实现超线性的性能提升。
💬 精华片段(中文)
极端协同设计之所以必要,是因为当前的问题已经无法塞进单台计算机、由单个GPU加速了。你要解决的问题是,算力提升速度要超过你新增的计算机数量:你加了1万台计算机,但你希望算力能提升100万倍。
"The reason why extreme co-design is necessary is because the problem no longer fits inside one computer to be accelerated by one GPU. The problem that you’re trying to solve is you would like to go faster than the number of computers that you add. So you added 10,000 computers, but you would like it to go a million times faster."
03:18 黄仁勋的NVIDIA管理方法论
本节重点
- NVIDIA的组织架构围绕产品需求设计,而非通用的企业模板
- 将CUDA植入GeForce是NVIDIA历史上最接近生死存亡的战略决策
- 战略落地核心是渐进式共识塑造,而非突然的顶层命令
详细精要
- 组织架构围绕产品设计,而非通用模板:黄仁勋的直接下属有60多人,几乎都是内存、CPU、光学、算法等各领域顶级专家。
- 不开一对一会议,所有问题集体讨论,各领域专家可以跨模块提出意见,比如散热专家可以指出某设计对供电的影响。
- 公司架构不是通用的“汉堡型”,而是完全匹配极端协同设计的需求,围绕要产出的产品设计组织形式。
- CUDA落地是NVIDIA历史上最接近生死存亡的战略决策:为了搭建CUDA生态,NVIDIA决定将CUDA植入所有GeForce消费级GPU,以此扩大装机量吸引开发者。
- 该决策让当时GPU成本上涨50%,完全吞噬了公司的毛利润,当时NVIDIA毛利率仅为35%,市值从70亿美元暴跌至15亿美元,花了10年才逐步收回成本。
- 黄仁勋判断装机量是计算架构的核心竞争力,比如x86架构之所以能战胜更优雅的RISC架构,核心就是装机量优势,因此哪怕承受短期损失也要搭建CUDA的用户基础。
- 战略落地核心是渐进式共识塑造,而非突然的顶层命令:黄仁勋不会突然发布全新战略、进行大规模组织调整,而是会持续向团队、董事会、合作伙伴传递对未来的判断,逐步塑造共识。
- 比如All in深度学习、收购Mellanox、发布Grok等重大决策之前,黄仁勋都会提前2-3年铺垫相关认知,到正式宣布时全公司、全行业都已经认可该方向,甚至会觉得“为什么现在才宣布”。
- 对外GTC大会的核心作用也是塑造全行业的共识,让合作伙伴提前做好配套准备,等NVIDIA产品发布时行业已经做好了落地准备。
💬 精华片段(中文)
安装基盘定义了一个架构,其他一切都是次要的。
"Install base defines an architecture. Not… Everything else is secondary, okay?"
22:40 AI缩放定律
本节重点
- AI存在四大缩放定律,分别为预训练缩放、后训练缩放、测试时间缩放、智能体缩放
- 合成数据将突破预训练的数据瓶颈,未来算力将成为AI能力的核心约束
- 推理的算力需求远高于预训练,智能体缩放将进一步放大算力需求
详细精要
- 四大缩放定律的核心逻辑:黄仁勋提出AI的能力提升遵循四大可延续的缩放规律,而非存在明确的天花板。
- 预训练缩放:模型越大、配套数据越多,AI能力越强,此前行业担心的“高质量人类数据耗尽”问题可以通过合成数据解决。
- 后训练缩放:通过合成数据、微调等方式持续提升模型能力,人类生成数据的占比将越来越低,数据不再是瓶颈。
- 测试时间缩放:即推理环节,推理本质是“思考”,需要进行推理、规划、搜索,算力需求远高于作为“阅读记忆”的预训练,此前行业认为“推理是小芯片就能做的简单任务”的判断完全错误。
- 智能体缩放:单个AI可以拆分出大量子智能体并行完成任务,类似公司通过招聘员工放大管理者的能力,算力需求将进一步指数级提升。
- 硬件设计需提前预判算法演进:AI模型架构每6个月就会迭代一次,而硬件架构的迭代周期为3年,因此必须提前预判未来的技术方向。
- NVIDIA通过内部基础研究、与全行业所有AI公司合作收集需求、保持CUDA架构的灵活性三大方式,确保硬件能适配未来的算法变化。
- 比如为了适配混合专家(MoE)模型,NVIDIA提前推出了NVLink 72,可以让10万亿参数的模型像运行在单个GPU上一样顺畅;最新的Vera Rubin机架则是为了适配智能体调用工具的需求提前设计的。
- 智能体是AI下一个核心拐点:黄仁勋认为OpenClaw对智能体系统的意义等同于ChatGPT对生成式AI的意义,将大幅加速AI的落地。
- 智能体必然会调用外部工具、访问真实数据,就像人形机器人会用人类的微波炉而非自己手指发射微波加热食物一样,这是非常符合第一性原理的判断。
- NVIDIA为此推出了NemoClaw与OpenShell,通过“最多开放三类权限中的两类”的安全机制,解决智能体的安全风险问题。
💬 精华片段(中文)
推理就是思考,我认为思考是很难的,思考比阅读难得多。
"You know, pre-training is just memorization and generalization, you know, and looking for patterns in relationships. You’re reading and reading, versus thinking, reasoning, solving problems, taking unexplored experiences, new experiences, and breaking it down into… Decomposing it into, you know, solvable pieces that we then go off, either through first principle reasoning, or, you know, through previous examples, prior experiences."
37:40 AI缩放的最大阻碍
本节重点
- 电力是AI缩放的核心阻碍之一,NVIDIA正通过极端协同设计每年将单位算力的能耗降低一个数量级
- 过去10年NVIDIA的算力提升了100万倍,远高于摩尔定律的100倍提升
- 虽然硬件价格在上涨,但单位token的生成成本每年下降一个数量级
详细精要
- 能效提升是突破电力约束的核心路径:NVIDIA通过全栈协同设计,过去10年实现了100万倍的算力提升,远高于摩尔定律同期的100倍提升。
- 当前单位token的生成效率提升速度远高于硬件价格上涨速度,因此token成本每年下降一个数量级,未来还会持续下降。
- 除了能效提升,也需要社会层面增加电力供应,支撑算力规模的扩张。
- 除电力外的其他阻碍均已在落地解决:供应链、内存、芯片产能等问题都已经通过与上下游合作伙伴的提前沟通、共识塑造落实了扩产计划,不需要过度担心。
- 黄仁勋会提前数年向供应链合作伙伴传递需求,说服其提前投入产能建设,避免出现瓶颈。
💬 精华片段(中文)
我们的计算机价格在上涨,但我们的token生成效率提升得快得多,因此token成本正在下降,每年都会下降一个数量级。
"You know, our computer price is going up, but our token generation effectiveness is going up so much faster that token cost is coming down. It’s just coming down an order of magnitude every year."
39:23 供应链管理
本节重点
- NVIDIA的增长速度是历史上所有公司中最快的,且还在加速,供应链是核心支撑
- 黄仁勋会提前向全供应链传递未来需求,帮助上下游合作伙伴制定投资决策
- NVIDIA当前一个Vera Rubin机架包含130万个组件,涉及200多家供应商
详细精要
- 供应链共识塑造是核心工作:黄仁勋会定期向上游芯片、下游基础设施等全供应链的数百家CEO传递NVIDIA的业务状况、未来增长驱动因素、长期技术方向,帮助其制定投资决策。
- 比如GTC大会邀请数百家供应链CEO参会,核心目的就是传递未来需求,统一行业认知。
- 黄仁勋还会定期拜访供应链合作伙伴,当面沟通未来1-2年的明确需求,建立信任关系。
- 机架级制造改变了供应链逻辑:此前的DGX是零件运输到数据中心组装,现在的NVLink 72机架是在供应链端就完成整个超级计算机的制造、测试,整机运输,重量可达2-3吨。
- 这要求供应链不仅要提升产能,还要配套更高的电力、测试能力,NVIDIA会提前与合作伙伴沟通相关需求,协助其完成配套升级。
- 当前NVIDIA每周需要生产约200个AI Pod才能满足市场需求,供应链的协同效率至关重要。
💬 精华片段(中文)
历史上没有任何一家公司能在我们这样的增长规模下还在加速增长,这太不可思议了,大多数人甚至无法理解这一点。
"No company in history has ever grown at a scale that we’re growing while accelerating that growth. It’s incredible. And it’s hard for people to even understand this."
41:18 内存供应链布局
本节重点
- 黄仁勋提前3年说服内存厂商投入HBM产能,当前HBM已经成为数据中心的主流内存
- 黄仁勋还推动了原本用于手机的LPDDR内存适配到数据中心超算中
- 当前三大内存厂商都因为相关布局获得了历史最高营收
详细精要
- HBM产能提前布局:3年前HBM还仅用于少量超算,黄仁勋说服头部内存厂商投入HBM产能,判断其未来会成为数据中心的主流内存,当前该判断已经完全兑现。
- 原本内存行业的主流产品是用于CPU的DDR内存,现在HBM已经成为增长最快的内存品类。
- 黄仁勋还推动了原本用于手机的低功耗LPDDR内存适配到数据中心超算中,开辟了新的内存应用场景。
- 信任是供应链合作的核心:黄仁勋会用第一性原理向合作伙伴解释需求背后的逻辑,给对方足够的提问机会,建立长期信任,因此合作伙伴愿意投入数十亿美金的资本支出配合NVIDIA的规划。
- 当前内存、晶圆、封装等各环节的供应商都对NVIDIA的需求有明确预期,扩产计划已经在落地,不会出现严重的产能瓶颈。
💬 精华片段(中文)
3年前我就说服了几家内存厂商的CEO,尽管当时HBM内存的应用非常少,几乎只有超算在用,但未来它会成为数据中心的主流内存。一开始听起来很荒谬,但几位CEO相信了我,决定投资建设HBM产能。
"About three years ago, I was able to convince several of the CEOs that even though at the time HBM memory was used quite scarcely, and barely by supercomputers, that this was going to be a mainstream memory for data centers in the future. At first it sounded ridiculous, but several of the CEOs believed me and decided to invest in building HBM memories."
47:24 电力问题解决方案
本节重点
- 当前电网99%的时间仅运行在峰值的60%左右,存在大量闲置电力,可以用来支撑数据中心算力需求
- 可以通过动态功率调节机制,在电网峰值期让数据中心降低功耗、转移负载,不影响民生用电
- 需要客户、数据中心、电网三方协同调整规则,释放闲置电力的价值
详细精要
- 电网闲置电力是核心增量资源:电网的设计是按照极端峰值需求预留冗余,一年中只有冬季、夏季的几天会达到峰值,其余99%的时间都有大量电力闲置。
- 这些闲置电力不需要额外新建电厂,只要调整规则就可以用来支撑数据中心的算力需求,是性价比极高的增量资源。
- 动态功率调节是可行的技术方案:数据中心可以设计为支持弹性功耗,在电网需要保障民生用电时,通过转移负载、降低非核心任务的运行速度、启用备用发电机等方式,降低电网供电需求。
- 该技术方案不存在物理层面的障碍,只要明确规则就可以快速落地。
- 三方协同是落地核心障碍:需要客户降低对数据中心100% uptime的过度要求,数据中心升级支持弹性功耗,电网推出差异化的供电服务(比如较低价格的非刚性供电),三方协同才能释放闲置电力的价值。
- 当前很多客户的严苛uptime要求是底层谈判人员制定的,企业CEO大多不知情,黄仁勋计划推动相关认知的普及。
💬 精华片段(中文)
99%的时间里,我们的电网都有多余的电力,它们就闲置在那里,但必须留着以备不时之需,保障医院、基础设施、机场的运行。我的问题是,我们能不能让大家理解,设计一种合同机制和计算机架构,让数据中心在社会需要最大电力保障时降低功耗,毕竟这种情况非常少见。
"And so 99% of the time, our power grid has excess power, and they’re just sitting idle, but they have to be there sitting idle because just in case, when the time comes, hospitals have to be powered and, you know, infrastructure has to be powered and airports have to run and so on and so forth. And so the question that I have is whether we could go and help them understand and create contractual agreements and design computer architecture systems, data centers, such that when they need the maximum power for infrastructure in society, that the data centers would get less."
52:43 马斯克与Colossus超算
本节重点
- xAI的Colossus超算仅用4个月就建成,当前已经拥有20万块GPU,还在持续扩张
- 马斯克的系统思维、极简主义、亲临一线、紧迫感是其能快速建成超算的核心原因
- 马斯克会质疑所有常规流程,剥离所有非必要环节,同时推动所有供应商将其项目列为最高优先级
详细精要
- 马斯克的超算建设方法论:马斯克是顶级的系统思考者,会从第一性原理出发质疑所有环节:是不是必要?必须这么做吗?必须花这么久吗?
- 他会剥离所有非必要的流程,保留核心功能,实现极简设计,同时亲临一线解决问题,比如会和一线工程师一起研究机架插线的流程,减少错误率,提升效率。
- 他的个人紧迫感会传递给所有合作伙伴,让所有供应商都将其项目列为最高优先级,因此能突破常规的工期限制。
- Colossus超算的示范意义:4个月建成20万GPU超算的案例证明,只要打破常规流程、提升协同效率,数据中心的建设速度还有极大的提升空间。
💬 精华片段(中文)
他能质疑一切,把所有环节压缩到只剩必要的部分,不能再去掉任何东西,同时保留产品必要的功能。他是你能想象到的最极致的极简主义者,而且是在系统级规模上做到这一点。
"And so he has the ability to question everything to the point where everything is down to its minimal amount that’s necessary, you can’t take anything else out. And yet the necessary capabilities of the product remains, you know? And so he is as minimalist as you could possibly imagine, and he does it at a system scale."
56:11 黄仁勋的工程与领导力方法
本节重点
- 黄仁勋的核心工程方法是“光速思维”:所有工作都要对标物理极限,而非基于现有水平做渐进式改进
- 他反对“持续改进”的思路,主张先回到零基,明确物理层面的极限可能性,再做合理的 trade-off
- 系统设计的原则是“必要的复杂度尽可能高,非必要的复杂度尽可能低”
详细精要
- 光速思维是核心工程方法:黄仁勋要求所有工作都对标物理极限,包括内存速度、计算速度、功耗、成本、时间、人力、制造周期等所有维度。
- 做设计时先明确不同约束下的物理极限,比如低延迟系统的极限、高吞吐量系统的极限,再根据需求做合理的权衡。
- 他反对“从当前74天优化到72天”的渐进式改进思路,而是先回到零基,明确物理层面最快能做到多久(比如可能是6天),再分析剩下的68天里哪些是必要的妥协,哪些是可以砍掉的冗余,这样优化效率会高得多。
- 系统设计的复杂度原则:所有复杂度必须是必要的,非必要的复杂度要全部砍掉。
- 比如一个Vera Rubin Pod包含7种芯片、5种专用机架、40个机柜、1.2 quadrillion个晶体管、近2万个NVIDIA die、1100多块Rubin GPU、60 exaflops算力、10PB/s的扩展带宽,这些复杂度都是支撑智能体运行的必要部分,没有冗余。
- 当前NVIDIA每周需要生产约200个这样的Pod才能满足市场需求,对供应链和制造能力都是极大的考验。
💬 精华片段(中文)
光速不只是关于速度,它是我对“物理能做到的极限是什么”的简写。我们做的每一件事都要和光速对标:内存速度、计算速度、功耗、成本、时间、人力、制造周期。
"The speed of light is not just about the speed. The speed of light is my shorthand for what’s the limit of what physics can do. And so every single thing that we do is compared against the speed of light. Memory speed, math speed, power, cost, time, effort, number of people, manufacturing cycle time."
01:01:37 中国市场与创新
本节重点
- 全球约50%的AI研究者是华人,其中大部分仍在中国,中国有非常好的理工科人才基础
- 中国省市之间的激烈竞争、开放共享的文化、工程师社会地位高,使其成为当前全球创新速度最快的国家
- 中国企业对开源的贡献度非常高,因为其文化中朋友、同学之间的知识分享非常普遍,没有过度的技术保密意识
详细精要
- 中国AI创新的核心优势:首先是人才优势,中国有大量受过良好理工科教育的人才,且工程师的社会地位很高,是典型的“builder国家”,很多政府官员本身就是顶尖工程师。
- 其次是内部竞争激烈,各省市、各企业之间的充分竞争筛选出了极具竞争力的企业,比如新能源汽车、AI领域都有大量优秀公司。
- 第三是文化上的开放共享,朋友、同学、同事之间的知识分享非常普遍,因此中国企业对开源的贡献度很高,加速了整个行业的创新速度。
- NVIDIA开源战略的核心逻辑:NVIDIA开源Nemotron 3等大模型,首先是为了提前研究未来的模型架构,指导硬件的协同设计;其次是推动AI向全行业、全国家渗透,让更多研究者、开发者能参与AI创新;第三是支撑多模态AI的发展,比如生物、物理、气象等非语言领域的AI模型落地。
- Nemotron 3是首个同时包含Transformer与SSM架构的大模型,完全开源了模型、权重、数据与训练流程,方便全行业在此基础上创新。
💬 精华片段(中文)
中国是当前世界上创新速度最快的国家,我刚才说的所有特点都根植于他们的孩子成长的方式、优秀的教育体系、父母对孩子学业的重视、他们的文化特质,这些都是这个国家的固有优势,而且他们恰好赶上了技术指数级增长的时代。
"So this is the fastest innovating country in the world today, and this is something that has everything that, everything that I’ve just said is fundamental to just how the kids were grown, the fact that they have excellent education, the fact that they, parents want them to do well in school, the fact that they, their culture is that way. These are, you know, these are just the thing about their country, and they showed up at precisely the time when technology is going through that exponential."
01:09:50 TSMC与台湾
本节重点
- TSMC的核心优势不只是先进制程,还有其能动态适配数百家客户需求的制造运营系统,以及技术与客户服务并重的文化
- 黄仁勋与TSMC合作了30年,累计达成了数千亿美金的交易,双方没有签订任何合同,完全基于信任
- 2013年张忠谋曾邀请黄仁勋担任TSMC CEO,黄仁勋因NVIDIA的使命而婉拒
详细精要
- TSMC的核心竞争力:首先是技术优势,包括先进晶体管、金属化系统、封装、3D堆叠、硅光子等全链路的技术积累,是全球唯一能提供最先进制程的厂商。
- 其次是卓越的制造运营系统,能动态适配数百家客户的需求变化(产能增减、交付提前/延后、紧急加单等),同时保持高良率、低成本、高交付可靠性。
- 第三是平衡的文化,同时做到了技术全球领先与客户服务全球领先,这在科技公司中非常少见,大多数公司只能做到其中一点。
- 第四是信任,TSMC的可靠度让黄仁勋敢把NVIDIA的整个供应链都放在TSMC之上,这是无形的核心资产。
- 黄仁勋与TSMC的渊源:黄仁勋出生于台湾,与TSMC创始人张忠谋是多年好友,2013年张忠谋曾邀请他担任TSMC CEO,黄仁勋因已经看到NVIDIA未来的发展潜力与使命而婉拒,认为自己的责任是把NVIDIA做好。
💬 精华片段(中文)
我们合作了30年,累计做了数千亿美金的生意,我们没有合同,这太棒了。
"Three decades, I don’t know how many tens, hundreds of billions of dollars of business we’ve done through them, and we don’t have a contract. That’s pretty great."
01:15:04 NVIDIA的护城河
本节重点
- NVIDIA最大的护城河是CUDA的安装基盘与生态,是20年持续投入、全公司4.3万名员工与数百万开发者共同建立的
- 开发者选择CUDA的核心原因是:CUDA每6个月就会升级一次,性能提升10倍;基于CUDA开发的软件可以覆盖数亿台设备、所有云厂商、所有行业、所有国家;NVIDIA会长期维护CUDA生态,可信度极高
- 第二大护城河是CUDA生态的广度,覆盖了从云到端、从超算到汽车、机器人、卫星等所有场景
详细精要
- CUDA生态是核心护城河:CUDA的成功不是靠技术本身,而是靠20年的持续投入,4.3万名NVIDIA员工的持续优化,以及数百万开发者的信任与参与,是无法短期复制的。
- 对开发者来说,选择CUDA意味着三个确定性:性能会持续快速提升、可以触达最大的用户群体、平台会长期稳定存在,这三个优势是其他竞品无法提供的。
- 现在CUDA已经迭代到13.2版本,还在持续快速演进,适配最新的AI模型与场景需求。
- 生态广度是第二大护城河:CUDA架构已经覆盖了所有云厂商、超算、企业级设备、边缘基站、汽车、机器人、卫星等几乎所有计算场景,是唯一的全场景通用AI计算架构。
- NVIDIA的计算单元已经从单个GPU,进化到计算机、集群,再到整个AI工厂,未来黄仁勋希望能实现行星级的计算单元规划。
💬 精华片段(中文)
如果我今天是开发者,我会首先优先选择CUDA,主要选择CUDA,这就是我认为最终分析下来我们的第一核心优势。
"If I were a developer today, I would target CUDA first. I would target CUDA most. And that’s the reason that I think in the final analysis is our first, that’s even our first core advantage."
01:20:41 太空AI数据中心
本节重点
- NVIDIA GPU已经进入太空,主要用于卫星在轨的AI图像处理,避免海量原始数据回传地球的带宽压力
- 太空计算的核心优势是可以24小时获取太阳能,核心挑战是没有对流、传导散热,只能靠辐射散热,还有辐射导致的硬件故障问题
- 黄仁勋认为当前地面还有大量闲置电力可以挖掘,太空计算是长期布局方向,短期不会成为主力
详细精要
- 太空计算的当前应用:当前NVIDIA GPU已经在卫星上用于在轨图像处理,卫星拍摄的厘米级高清图像不需要全部回传地球,在轨AI处理后只回传变化的部分,大幅节省带宽。
- 极地轨道的卫星可以24小时获得太阳能,能源供给稳定。
- 太空计算的核心挑战:首先是散热问题,太空中没有空气,只能靠辐射散热,需要设计大面积的散热器;其次是宇宙辐射会导致硬件故障,需要设计冗余、 graceful degradation的机制;第三是软件的远程维护难度大。
- NVIDIA已经在布局相关技术研发,包括抗辐射设计、故障检测、冗余机制、弹性计算等,但短期不会成为算力的主力供给。
💬 精华片段(中文)
我是个非常务实的人,我会先找下一个桶里的机会,同时布局太空。我派工程师去研究相关问题,我们正在学习很多东西:怎么应对辐射?怎么处理性能下降?怎么持续检测缺陷?怎么处理冗余?怎么实现优雅降级?
"You know, I’m just so much more practical. I look for where my next, next bucket of opportunities are first. Meanwhile, I’m cultivating space. And so I send, I send engineers to go work on the problem. We’re starting to… We’re learning a lot about it. How do we deal with radiation? How do we deal with degrading performance? How do we deal with a continuous testing and attestation of defects? And you know, how do we deal with redundancy? And how do we degrade gracefully and things like that?"
01:24:30 NVIDIA会不会达到10万亿美元市值
本节重点
- 黄仁勋认为NVIDIA的增长是必然的,核心逻辑是计算已经从检索型转向生成型,从“仓库”变成“工厂”,直接创造收入
- 未来计算占全球GDP的比例会提升100倍,因为计算不再是存储成本项,而是产品生成的收入项
- Token会成为可定价的商品,会出现不同层级的token定价,高价值场景下每百万token的定价可达1000美元
详细精要
- 计算范式变革是增长核心驱动:过去的计算机主要是检索系统,存储人类预先生成的内容,核心需求是存储;现在的AI计算机是生成系统,实时生成上下文相关的内容,核心需求是计算,计算的需求量会指数级增长。
- 过去的计算机是“仓库”,不直接产生收入;现在的AI计算机是“工厂”,生产的token是有价值的商品,直接和企业收入挂钩,因此企业愿意为算力支付更高的费用。
- Token经济的潜力:Token会像iPhone一样分层,有免费的基础token、 premium token,高价值专业场景下(比如药物研发、芯片设计),用户愿意为高质量的推理结果支付每百万token 1000美元的费用,这个市场的空间非常大。
- 全球GDP会因为AI的推动加速增长,计算占GDP的比例会比现在提升100倍,NVIDIA作为核心算力提供商,会享受整个行业的增长红利。
- 对市值的态度:黄仁勋认为10万亿美元只是一个数字,没有物理层面的限制,NVIDIA的增长是和200多家供应链合作伙伴共同实现的,没有瓶颈。
- 过去不断有人说NVIDIA的增长有天花板:“无晶圆厂半导体公司不可能超过10亿美元营收”、“不可能超过250亿美元营收”,这些判断都不符合第一性原理,现在都被证伪了。
- NVIDIA的增长不是靠抢占现有市场份额,而是靠创造全新的市场,因此想象空间非常大。
💬 精华片段(中文)
我完全相信全球GDP的增长会加速,我也完全相信,GDP中用于计算的比例会比过去高100倍,因为它不再是存储单元,而是产品生成单元。
"I am absolutely certain that the world’s GDP is going to accelerate in growth. I’m absolutely certain the percentage of that GDP that will be used for computation will be 100 times more than the past—mm-hmm—because it’s no longer a storage unit. It’s a product generation unit."
01:34:39 压力下的领导力
本节重点
- 黄仁勋应对压力的核心方法是拆解问题,明确哪些是可以改变的,哪些是不能改变的,对可以改变的问题制定行动计划,分配给合适的人解决
- 他会把所有的担忧都告诉相关的负责人,不会自己扛着,分担压力的同时推动问题解决
- 应对低谷的核心是“系统性遗忘”,不要纠结过去的失误,专注于未来的机会,像运动员一样只关心下一个球
详细精要
- 压力的来源与应对:黄仁勋清楚NVIDIA的成功对美国的科技领导力、国家安全、税收、就业,对全球数百万投资者、供应链合作伙伴、开发者都至关重要,压力非常大。
- 他应对压力的方法是拆解问题:先明确问题的情况、变化、难点,再制定具体的行动计划,要么自己解决,要么分配给合适的人解决,不要焦虑无法改变的事情。
- 只要所有可能造成风险的问题都已经通知到相关负责人,有了解决方案,就可以安心睡觉。
- 应对低谷的方法:首先是系统性遗忘,不要纠结过去的失败、尴尬、 humiliation,要学会放下;其次是被未来的机会吸引,专注于下一个目标;第三是保持初心,像孩子一样问“这能有多难”,不要提前预判所有的困难,保持乐观。
- 黄仁勋说如果早知道创办NVIDIA会比想象中难100万倍,他可能不会创办,但正是这种“无知者无畏”的初心,加上遇到困难时的韧性,才让他走到现在。
- 保持谦卑的方法:因为很多工作都是公开的,一旦犯错所有人都能看到,会被随时提醒,因此不会因为成功而傲慢;此外他做决策时会公开推理过程,所有人都可以质疑他的推理步骤,不会出现一言堂的情况。
💬 精华片段(中文)
如果我知道创办NVIDIA会比我预期的难100万倍,我就不会做了。但这正是所有值得做的事情的共同点,对吧?
"Yeah, right. That is, by the way, what I was trying to explain, is that there’s an incredible superpower of having the mind of a child. You know? And I say to myself oftentimes when I look at something, and almost everything my first thought is, “How hard can it be?” You know?"
01:48:25 电子游戏
本节重点
- GeForce是NVIDIA至今最重要的营销策略,很多用户从青少年时期玩游戏认识NVIDIA,后来工作中成为CUDA的用户
- DLSS 5不是AI生成“内容垃圾”,而是基于3D几何、纹理的真实结构做增强,完全尊重艺术家的原始设计,不会改变内容风格
- 黄仁勋认为历史上最有影响力的游戏是《Doom》,它第一次让PC从办公工具变成了游戏设备;技术层面最有影响力的是《Virtua Fighter》。
详细精要
- GeForce的生态价值:GeForce不仅是游戏GPU,更是NVIDIA CUDA生态的入口,数百万青少年通过玩游戏认识NVIDIA,上大学、工作后自然会选择CUDA做开发,是NVIDIA生态的重要基础。
- DLSS 5的争议回应:黄仁勋理解玩家对“AI slop”的担忧,但DLSS 5是基于3D几何、艺术家设定的纹理、结构做增强,完全忠实于原始设计,不会改变内容的风格,只是提升画质和帧率。
- DLSS 5是开放的,开发者可以训练自己的风格模型,甚至可以prompt生成特定的艺术风格,比如卡通渲染,是给艺术家提供的工具,而非替代艺术家的创作。
- 最有影响力的游戏:《Doom》的文化影响力最大,让PC从办公工具变成了消费电子设备,推动了整个PC游戏行业的发展;技术层面《Virtua Fighter》的贡献最大,是早期3D游戏的代表。
💬 精华片段(中文)
DLSS 5是3D条件引导、3D结构指导的,是基于真实的结构数据做增强,艺术家决定了几何结构,我们完全忠于每一帧的几何结构,基于艺术家设定的纹理做增强,不会改变任何东西。
"But DLSS 5 is 3D-conditioned, 3D-guided. It’s ground truth structure data guided. And so the artist determined the geometry. We are completely truthful to the geometry maintained in every single frame. It’s conditioned by the textures, the artistry of the artist. And so every single frame, it enhances but it doesn’t change anything."
01:55:16 AGI时间线
本节重点
- 黄仁勋认为当前已经实现了基础AGI,AI已经可以做出估值10亿美元的公司,比如开发一个爆款应用、数字人,短期实现大量用户与收入
- AGI不代表可以复制NVIDIA这样需要几十年积累的公司,也不代表可以替代人类的所有能力
- AI不会替代工作,只会替代任务,比如计算机视觉虽然在2020年就超过了人类,但放射科医生的数量反而增长了,因为效率提升后需求变大了。
详细精要
- 当前的AGI水平:黄仁勋认为如果把AGI定义为能完成人类大多数认知任务,那么现在已经实现了基础AGI,比如AI已经可以独立开发爆款应用、数字人,实现数亿美元的估值,甚至10亿美元级别的公司。
- 但这种AGI无法复制NVIDIA这样需要几十年技术积累、生态积累、供应链积累的复杂公司,也不具备人类的情感、品格等特质。
- AI对就业的影响:黄仁勋以放射科医生为例,2019年左右计算机视觉就超过了人类的读片能力,当时很多人预测放射科医生会失业,但实际上现在全球放射科医生的数量反而增长了,还存在缺口。
- 核心原因是AI提升了读片效率,让医生可以处理更多的病例、诊断更准确,医院的收入提升,反而需要更多的医生,AI替代的是“读片”这个任务,而非“放射科医生”这个职业。
💬 精华片段(中文)
我认为我们已经实现了AGI。
"I think it’s now. I think we’ve achieved AGI."
01:57:29 编程的未来
本节重点
- 未来编程的定义会变成“需求定义”,只要能清晰描述想要的功能,就是编程,全球的程序员数量会从3000万增长到10亿
- 传统的编程知识依然有价值,能帮助开发者更好地定义需求、设计架构、和AI协同
- 应对AI带来的职业焦虑的核心方法是学习使用AI工具,成为所在行业的AI应用专家,提升自己的不可替代性。
详细精要
- 编程范式的变革:未来编程不需要写具体的代码,只需要清晰地描述需求、定义架构,AI会自动生成代码,这会大幅降低编程的门槛,让全球能“编程”的人数从3000万增长到10亿。
- 传统的编程知识、软件设计原则依然有价值,能帮助人们更好地定义需求、判断AI生成代码的质量、设计更合理的系统架构。
- 所有职业都会因为AI工具实现能力升级,比如木匠会变成建筑师,会计会变成财务顾问,职业的价值会提升而非降低。
- 应对职业焦虑的建议:黄仁勋建议所有人都要学习使用AI工具,不管是程序员、会计、营销人员、供应链人员、律师、农民、木匠,都要成为所在行业的AI应用专家,用AI提升自己的能力。
- 企业招聘时会优先选择会用AI的候选人,不会用AI的人会被淘汰;如果你的工作内容只是单一的重复性任务,那么被替代的风险很高,要尽快升级自己的能力。
- AI本身可以成为学习AI的老师,它会手把手教你怎么用,降低学习门槛。
💬 精华片段(中文)
我认为现在编程的定义就是需求说明,如果你愿意的话甚至可以给出你想要的软件架构。那么问题来了,有多少人能做到这件事?描述一个需求让计算机去搭建。我认为我们刚好处在这个节点,能做到的人数从3000万变成了可能10亿。
"What is the definition of coding? I believe it is… The definition of coding, as of today, is simply specifying, specification, and maybe if you want to be rather directive, you could even give it an architecture of the software that you wanted to write. So the question is, how many people could do that? Describe a specification for a computer to go… telling the computer what to go build. How many people? I think we just went from 30 million to probably 1 billion."
02:11:01 意识与人性
本节重点
- 黄仁勋认为AI可以识别、模拟人类的情绪,但无法真正感受情绪,比如不会感到紧张、焦虑、兴奋,因此不会出现和人类完全一样的主观体验。
- 智力是功能性的,是一种可以 commoditize 的能力,而人性、品格、同情心、 generosity、韧性这些特质才是人类的核心价值,远比重智力更重要。
- 黄仁勋认为自己身边的专家在各自领域都比他聪明,但他依然能领导团队,靠的就是这些非智力的特质。
详细精要
- AI与意识的差异:AI可以生成类似人类情绪的反应,也能识别人类的情绪,但它无法真正“感受”到情绪,因此不会出现因为情绪导致的表现波动,比如人类运动员在压力下可能超常发挥或者发挥失常,AI不会有这种情况。
- 智力是功能性的,有明确的定义:感知、理解、推理、规划,这个闭环就是智力,它不是人类独有的,未来会成为 commoditize 的商品。
- 人类的核心价值:人性、品格、同情心、 generosity、韧性、抗压能力、领导力这些非智力的特质才是人类的核心价值,是AI无法复制的。
- 黄仁勋说自己身边的60个直接下属在各自领域的智力都比他高,学历也比他好,但他能领导团队,靠的就是这些非智力的特质。
- 社会过度抬高了智力的价值,实际上人生的成功、社会的运行更依赖于这些非智力的人性特质。
💬 精华片段(中文)
智力是一个功能性的东西,人性不是用功能定义的,它是一个大得多的词。我们的人生体验、对痛苦的耐受、决心,这些都是和智力不同的词。我想帮助观众理解的一点是,我们过去把智力这个词抬得太高了。
"And so, but that’s my point. My point is intelligence is a functional thing. Humanity is not specified functionally. It’s a much, much bigger word. And our life experience, our tolerance for pain, our determination, those are different words than intelligence. And so the thing that I wanna help the audience understand, if I could give them one thing, is intelligence is a word that we’ve elevated to a very high form over time."
02:17:22 死亡与未来希望
本节重点
- 黄仁勋不做继任计划,而是持续向团队传递知识、经验、认知,每天都在培养团队的能力,让所有人都能独当一面,这才是最好的继任准备。
- 他希望能一直工作到死,最好是瞬间去世,不要有长期的病痛。
- 他对未来的希望来自于对人类善良、慷慨、同情心的信任,以及AI带来的解决疾病、污染、能源等重大问题的可能性,现在是人类历史上最令人兴奋的时代。
详细精要
- 对死亡的态度:黄仁勋不想死,因为他有很棒的家庭、很重要的工作,现在正在经历的是人类历史上独一无二的时代,NVIDIA正在做非常重要的事情。
- 他不做传统的继任计划,而是在日常的每一次会议、每一次交流中都向团队传递自己的知识、经验、思考方式,持续提升团队的能力,这才是最好的继任准备。
- 他希望能一直在岗位上工作到去世,最好是瞬间离世,不要有长期的病痛。
- 对未来的希望:黄仁勋始终相信人类的善良、慷慨、同情心,绝大多数人都想做好事、帮助别人,这一点不断被验证。
- AI带来的算力提升让很多过去不可能解决的问题变得可行:终结疾病、大幅减少污染、甚至实现近光速旅行,这些都有可能在他的有生之年实现。
- 他认为未来可以把人类的知识、意识上传到AI,和人形机器人一起发射到太空,实现星际探索。
💬 精华片段(中文)
怎么能不对未来充满浪漫的想象?终结疾病是合理的预期,污染大幅减少是合理的预期,近光速旅行真的在我们的未来里。
"How can you not be romantic about that? The fact that there is a—it’s a reasonable thing to expect the end of disease. It’s a reasonable thing to expect. It’s a reasonable thing to expect that pollution will be drastically reduced. It’s a reasonable thing to expect that traveling at the speed of light is actually in our future."
专业术语注释
| 术语 |
解释 |
| CUDA(Compute Unified Device Architecture) |
NVIDIA推出的通用并行计算架构,让GPU可以处理复杂的计算任务,是NVIDIA生态的核心基础,当前最新版本为13.2 |
| 阿姆达尔定律(Amdahl's Law) |
计算机科学中的经典定律,指系统中某一组件加速后,对系统整体性能的提升取决于该组件在总工作负载中的占比 |
| 登纳德缩放(Dennard Scaling) |
半导体行业的经典规律,指晶体管密度提升时,单位面积的功耗保持不变,该规律在2000年后逐渐失效 |
| HBM(High Bandwidth Memory) |
高带宽内存,相比传统DDR内存带宽更高、功耗更低,是AI GPU的核心配套组件 |
| CoWoS(Chip on Wafer on Substrate) |
TSMC推出的先进封装技术,可将多个芯片集成在同一个封装内,提升性能、降低功耗 |
| MoE(Mixture of Experts) |
混合专家模型,一种大模型架构,将任务分配给不同的“专家”子模型处理,大幅提升模型效率 |
| NVLink |
NVIDIA推出的高速互联技术,用于GPU之间、GPU与CPU之间的高速数据传输,当前最新版本为NVLink 72 |
| DGX |
NVIDIA推出的AI专用超级计算机系列,是AI训练与推理的核心硬件产品 |
| OpenClaw |
开源智能体框架,黄仁勋认为其对智能体系统的意义等同于ChatGPT对生成式AI的意义 |
| GTC(GPU Technology Conference) |
NVIDIA主办的全球GPU技术大会,是黄仁勋发布新产品、传递行业判断的核心平台 |
| EUV(Extreme Ultraviolet) |
极紫外光刻,当前最先进的芯片制造工艺,仅ASML可生产相关设备 |
| AGI(Artificial General Intelligence) |
通用人工智能,指具备与人类相当的通用认知能力的AI系统 |
| DLSS(Deep Learning Super Sampling) |
NVIDIA推出的深度学习超采样技术,通过AI提升游戏画面分辨率与帧率,当前最新版本为DLSS 5 |
| SSM(Structured State Model) |
结构化状态空间模型,一种新型AI模型架构,相比Transformer在长序列处理上更有优势 |
延伸思考
- 如何评估黄仁勋提出的“AI算力将从芯片级扩展到行星级”的判断,未来全球算力基础设施的竞争格局会发生哪些变化?
- 黄仁勋认为CUDA装机量是NVIDIA最大的护城河,当前国内AI芯片厂商在生态建设上可以借鉴哪些经验,又有哪些差异化路径?
- 黄仁勋提出的“编程将从写代码转向需求定义”的范式转变,会对未来的计算机教育、人才培养体系产生哪些影响?
- 针对AI带来的职业焦虑,除了“学习使用AI工具”之外,政府、企业还应出台哪些配套措施缓解技术转型带来的社会阵痛?
- 黄仁勋提到中国是当前全球创新速度最快的国家,如何看待中国AI产业在开源生态、应用创新上的优势,以及面临的供应链限制挑战?
原文发表:Mar 23, 2026 · 纪要生成:2026-04-20