《Dwarkesh播客：独家对话黄仁勋》

来源： Substack | 黄仁勋（Jensen Huang） | 2026-04 分类： NVIDIA 原文发表： Apr 15, 2026 纪要生成： 2026-04-20

本期赞助商

Crusoe：云服务采用最先进的Blackwell GPU，Vera Rubin算力集群将于2026年下半年上线，自研MemoryAlloy技术实现集群级KV cache，TTFT速度比vLLM最高快10倍，吞吐量提升5倍。
Cursor：AI代码编辑器，支持通过谷歌文档内联评论与AI协同编程，底层实现透明可控，用户可基于其快速搭建专属AI Agent。
Jane Street：投入约20000 GPU小时在3个大模型中植入后门，发起公开挑战赛无人能全部破解，目前正在招募AI安全方向的人才。

全集重点

核心护城河：覆盖全产业链的生态、CUDA可编程性与供应链协同能力，难以被复制。
TPU竞争：专用ASIC场景有限，英伟达通用加速计算的TCO与生态优势难以替代。
出口争议：过度限制对华芯片出口将损害美国长期科技领导地位，应平衡监管与竞争。
战略选择：坚持“做必要且最少的事”，不做云服务商、不押注单一AI公司，维护开放生态。

嘉宾/话题简介

黄仁勋（Jensen Huang）是英伟达（Nvidia）创始人兼CEO，主导了GPU与CUDA生态的搭建，是全球AI计算产业的核心推动者。本期播客中，他全面回应了英伟达供应链护城河、TPU等竞品威胁、是否下场做云服务商、对华AI芯片出口等外界高度关注的核心争议，首次披露了英伟达对大模型公司的投资逻辑与下一代芯片的迭代规划，信息量极大。

分节详述

00:00:00 英伟达最大的护城河是对稀缺供应链的掌控吗？

本节重点

英伟达核心价值是实现“电子到Token”的转换，技术复杂度极高，难以被 commoditize。
供应链优势是生态协同的结果，而非刻意垄断，全产业信息对齐是产能匹配的核心。
短期硬件瓶颈均可在2-3年内解决，长期制约AI发展的核心是能源政策。
AI普及将带动工具类软件需求爆发，而非导致软件 commoditize。

详细精要

「电子到Token」的转换价值难以被 commoditize
黄仁勋提出英伟达的核心定位是完成电子输入到AI Token输出的转换，该过程涉及大量工程、科学创新与艺术级优化，不存在短期被 commoditize 的可能。
英伟达的运营逻辑是“做必要且最少的事”，非核心环节全部交由生态伙伴完成，目前已搭建覆盖上游供应链、下游硬件厂商、应用开发者、模型厂商的全五层AI产业生态。
他不认同“AI将 commoditize 软件”的观点，认为未来AI Agent数量将指数级增长，工具类软件（如Synopsys EDA工具、Excel等）的使用实例将大幅提升，相关软件厂商的市场空间反而会扩大。
供应链优势是生态协同的结果而非刻意垄断
英伟达目前已与代工厂、存储、封装厂商签订近1000亿美元的采购承诺，SemiAnalysis报告显示未来该数字将达2500亿美元，产能锁定是基于对AI产业规模的预判，而非刻意挤压竞争对手。
黄仁勋称其花费大量时间与上游供应链CEO沟通AI产业的未来规模，说服供应链提前扩产，而供应链愿意配合的核心原因是英伟达下游需求规模足够大、确定性足够高。
GTC大会的核心作用之一是打通上下游信息差，让全生态清晰看到AI产业的发展节奏，统一扩产预期，避免供需错配。
短期硬件瓶颈均可在2-3年内解决，长期瓶颈是能源
过往被视为核心瓶颈的CoWoS封装产能，经过两年的全产业资源投入已实现多轮翻倍，目前供需已基本平衡。
逻辑产能、EUV光刻机等硬件瓶颈的扩张周期均在2-3年以内，只要有明确的需求信号，不存在无法解决的产能问题。
黄仁勋认为长期制约AI产业发展的核心瓶颈是能源政策，无论是芯片制造、数据中心建设还是AI工厂落地，都需要充足的能源供给，而能源相关审批与建设周期远长于硬件产能扩张。
产业扩张的核心制约是下游需求确定性而非上游产能
英伟达目前每年收入翻倍、总算力供给年增3倍的增长速度具备可持续性，上游产能扩张可匹配该增速。
SemiAnalysis数据显示AI产业2026年将占台积电N3节点产能的60%，2027年将占86%，作为台积电最大客户，英伟达的产能优先级远高于其他厂商。
上游供应链不会为低商业确定性的架构投入产能，英伟达的规模优势本质是下游需求的高确定性带来的供应链信任溢价。

💬 精华片段（中文）

"In the end, something has to transform electrons to tokens. The transformation of electrons to tokens and making those tokens more valuable over time is hard to completely commoditize."

00:16:25 TPU会打破英伟达对AI计算的掌控吗？

本节重点

英伟达的核心产品是通用加速计算，适用场景远广于TPU等专用ASIC。
CUDA的可编程性支持AI算法快速迭代，性能提升空间远高于单纯硬件升级。
英伟达的TCO、性能功耗比全球领先，没有竞品可证明其综合成本优势。
Anthropic使用TPU是早期投资绑定的特例，而非行业普遍趋势。

详细精要

通用加速计算的适用场景远优于专用ASIC
黄仁勋指出TPU等专用张量处理器仅能支持矩阵乘法等固定AI workload，而英伟达的加速计算可覆盖分子动力学、量子色动力学、流体仿真、数据处理、AI等全场景 workload，市场空间远大于专用ASIC。
英伟达的硬件设计面向通用运营场景，所有云厂商、企业、科研机构均可直接采购使用，而谷歌TPU、AWS Trainium等自研芯片仅能适配自有业务场景，无法对外提供通用服务。
目前英伟达的算力已覆盖所有主流云厂商，包括谷歌、AWS、Azure、OCI，是唯一实现全云覆盖的AI算力供应商。
CUDA的可编程性是AI快速迭代的核心基础
AI算法迭代速度极快，新型注意力机制、SSM架构、扩散与自回归融合模型等创新都需要可编程的硬件架构支持，专用ASIC无法适配快速变化的算法需求。
硬件工艺升级带来的摩尔定律性能提升仅为每年25%，而通过CUDA生态实现的算法、架构、系统协同优化可实现每年10-100倍的性能飞跃，Blackwell相对上一代Hopper 30-50倍的性能提升核心来自协同优化而非工艺升级。
英伟达深度参与Triton等开源算子框架的开发，CUDA生态的稳定性与成熟度可帮助开发者减少底层调试成本，将更多精力放在上层算法创新上。
生态安装基数与全云覆盖构成难以突破的壁垒
目前英伟达全球GPU安装量已达数亿级，覆盖从消费级显卡到数据中心级H100、H200、A100等全产品线，所有主流云厂商均支持英伟达算力，开发者编写的代码可在几乎所有硬件环境中运行。
对于AI公司而言，选择英伟达架构意味着可灵活选择任意云厂商、任意部署环境（公有云/私有云/本地部署），不存在供应商锁定风险，适配成本远低于专用ASIC。
面向云厂商的英伟达算力中，超过60%的需求来自外部客户而非云厂商自用，云厂商愿意优先采购英伟达算力的核心原因是其可覆盖最广泛的客户群体。
英伟达的TCO与性能功耗比优势没有竞品可及
黄仁勋称目前没有任何厂商能证明其AI计算方案的TCO（总拥有成本）低于英伟达，MLPerf、InferenceMAX等公开基准测试中，TPU、Trainium等竞品均未参与验证其宣称的成本优势。
英伟达的性能功耗比全球领先，同等功耗的数据中心采用英伟达方案可产出最多的Token，直接提升云厂商的收入天花板。
英伟达的技术团队可为客户提供深度优化支持，通常可帮助客户将模型性能提升2-3倍，直接转化为客户的收入增长。
Anthropic使用TPU是早期投资绑定的特例而非趋势
Anthropic选择TPU的核心原因是早期英伟达无法提供数百亿级的战略投资支持，而谷歌、AWS通过投资绑定了Anthropic的算力采购，并非TPU的性能或成本优于英伟达方案。
即便OpenAI、Anthropic等头部厂商尝试自研或采用其他算力，其核心算力需求仍以英伟达为主，专用ASIC的替代规模极小。
黄仁勋称英伟达不会排斥客户尝试其他方案，反而认为这会让客户更清晰地认知到英伟达方案的优势，英伟达会持续通过技术迭代守住市场地位。

💬 精华片段（中文）

"Nvidia’s computing stack is the best performance per TCO in the world, bar none. Nobody can demonstrate to me that any single platform in the world today has a better performance-TCO ratio. Not one company."

00:41:06 英伟达为什么不自己做超大规模云服务商？

本节重点

英伟达核心战略是“做必要且最少的事”，云服务赛道已有充足参与者，无需下场竞争。
英伟达通过投资AI新云厂商的方式补充生态，而非亲自运营云业务，避免与客户竞争。
对大模型公司的投资遵循“不押注单一赢家”原则，维护生态的开放性与公平性。
芯片分配遵循先到先得、定价稳定的原则，核心目标是成为AI产业的可靠基础设施。

详细精要

「做必要且最少的事」是英伟达的核心经营哲学
黄仁勋认为如果英伟达不做加速计算架构、CUDA生态、CUDA-X领域专用库等核心技术，这些技术就不会出现，因此这些是英伟达必须做的核心业务。
云服务赛道已有大量成熟参与者，即便英伟达不做，也会有其他公司进入，因此不属于英伟达必须介入的领域，下场做云反而会与现有云客户形成直接竞争，损害生态信任。
英伟达过往20年投入CUDA生态时长期处于亏损状态，这种投入强度是其他公司无法做到的，也是英伟达核心壁垒的来源。
投资生态而非亲自下场，维护全行业公平性
英伟达会为CoreWeave、Nscale、Nebius等AI新云厂商提供最高63亿美元的流动性支持与投资，帮助其落地发展，丰富云生态的多样性，避免头部云厂商垄断算力供给。
英伟达对大模型公司的投资遵循“不选赢家”的原则，会投资所有具备潜力的大模型厂商，原因是黄仁勋创业初期英伟达也曾被视为最不可能存活的3D图形公司，他认为没有人能准确预判产业最终的赢家。
英伟达不会介入金融业务，会与专业金融机构合作解决客户的融资需求，核心精力仍放在技术研发与生态建设上。
稳定的供给与定价策略是英伟达作为产业基础设施的核心责任
英伟达的芯片分配遵循先到先得原则，仅会根据客户数据中心的落地进度微调交付顺序，最大化产能利用率，不存在向特定公司倾斜的情况，网传马斯克、拉里·佩奇向黄仁勋求购GPU的消息不实。
英伟达不会采用价高者得的定价策略，即便供不应求也不会随意涨价，核心目标是成为AI产业可信赖的稳定供应商，与台积电的长期合作也基于同样的信任逻辑。
英伟达每年的产品迭代节奏稳定，客户可提前数年规划算力采购，确定性远高于其他ASIC厂商，这也是英伟达生态粘性的重要组成部分。
早期未投资大模型是认知与能力局限，未来会持续支持生态创新
黄仁勋坦言早期没有意识到大模型公司的融资需求无法通过传统VC满足，英伟达当时也没有对外大额投资的规划与能力，因此错失了早期投资OpenAI、Anthropic的机会，未来会持续为有潜力的AI公司提供投资与算力支持。
即便未早期投资，英伟达仍为大模型公司的发展提供了核心算力支持，Anthropic等公司的成长对整个AI产业都是利好，英伟达对此乐见其成。

💬 精华片段（中文）

"This is a philosophy of the company, and I think it’s wise. We should do as much as needed, as little as possible. What that means is, the work that we do with building our computing platform, if we don’t do it, I genuinely believe it doesn’t get done."

00:57:36 我们应该向中国出售AI芯片吗？

本节重点

中国已具备充足的AI算力基础，过度限制出口无法阻止其AI技术发展。
限制出口将迫使中国发展自主生态，长期损害美国科技领导地位。
应对AI安全风险的核心是建立全球对话机制，而非单纯技术封锁。
应平衡监管与市场竞争，避免主动放弃全球第二大科技市场。

详细精要

中国已具备充足的AI算力基础，限制出口无法阻止其AI发展
黄仁勋指出中国已拥有全球60%的主流芯片产能、50%的AI研究人员，能源供给充足，即便没有最先进的英伟达芯片，也可通过多颗7nm芯片集群、硅光子互联等方式搭建足够的算力，满足训练先进大模型的需求。
华为等中国芯片厂商2025年出货量达数百万颗，已远超Anthropic等头部大模型公司的算力需求，限制英伟达芯片出口并未显著降低中国的AI算力供给。
HBM2等存储芯片无需EUV光刻机即可生产，中国可通过规模堆叠的方式弥补内存带宽差距，不存在无法解决的硬件瓶颈。
算法创新的权重远高于硬件，限制出口反而会加速中国自主生态发展
摩尔定律带来的硬件性能年增速仅为25%，而算法创新可带来每年10倍以上的性能提升，中国庞大的AI研究人员群体是其最大的优势，硬件限制反而会倒逼其投入更多资源进行算法创新。
目前中国的开源模型仍基于英伟达技术栈开发，如果限制出口，这些开源模型会转向适配中国自主芯片架构，长期来看将形成与美国并行的技术生态，当这些模型向全球南方、中东等地区输出时，会挤压美国技术栈的市场空间。
过往美国对电信行业的过度管制已导致美国失去全球电信市场主导权，对芯片行业的类似管制最终会带来同样的后果。
应对AI安全风险的核心是全球对话而非技术封锁
黄仁勋认为将AI芯片类比为核武器、浓缩铀的逻辑完全不成立，AI芯片与CPU、DRAM、电力一样是通用技术，可用于大量正向场景，不能因存在潜在风险就全面封锁。
应对AI的网络攻击等安全风险，核心方式是建立全球AI研究人员的对话机制，共同约定AI的禁用场景，同步推进AI安全技术的研发，而非单纯限制硬件出口。
美国应通过优先为本土实验室提供最先进算力、加大本土AI研究投入的方式保持领先地位，而非通过封锁对手的方式维持优势。
平衡监管与市场竞争才符合美国长期利益
黄仁勋不反对对最先进的芯片进行适度出口管制，确保美国本土始终掌握最领先的算力，但反对全面放弃中国市场，这种做法相当于主动将全球第二大科技市场拱手让人。
中国占全球科技市场的40%，放弃该市场会降低美国芯片企业的收入与研发投入能力，最终损害美国的技术领先地位。
全球AI生态的开放符合美国利益，应尽可能让全球所有AI开发者都基于美国技术栈进行创新，而非强迫其转向其他技术栈。

💬 精华片段（中文）

"The single most important thing to our company is the richness of our ecosystem, which is about developers. 50% of the AI developers are in China. The United States should not give that up. Comparing AI to anything that you just mentioned is lunacy."

01:35:06 英伟达为什么不开发多种不同的芯片架构？

本节重点

现有架构已通过仿真验证为最优，其他架构的综合性能均不如现有方案。
收购Groq是为了适配推理市场分层需求，覆盖高响应速度的premium Token场景。
即便没有深度学习革命，英伟达也会通过加速计算在科学计算等领域取得成功。

详细精要

现有架构已为最优，多架构并行没有商业价值
黄仁勋称英伟达已通过内部仿真验证了Cerebras晶圆级、Dojo大封装等多种特殊架构的性能，这些架构的综合表现均不如现有通用GPU架构，因此无需投入资源研发。
复用成熟架构可大幅降低研发成本，提升供应链规模效应，将更多资源投入到架构迭代与生态优化上，投入产出比远高于多架构并行。
如果未来AI workload发生根本性变化，英伟达会考虑新增专用架构，但目前没有相关必要。
收购Groq是为了适配推理市场的分层需求
目前AI推理市场已出现分层，部分高端场景（如AI辅助编程、实时交互）愿意为更低的响应时间支付更高的溢价，这类场景对吞吐量的要求低于对延迟的要求。
英伟达的现有架构主打高吞吐量，无法最优适配低延迟高溢价的推理场景，因此收购Groq将其纳入CUDA生态，补充这一细分市场的产品矩阵。
未来英伟达会根据市场需求的变化持续扩充产品线，覆盖更多细分场景，而非局限于单一架构。
加速计算是英伟达的核心使命，AI只是其中一个应用场景
黄仁勋表示即便没有深度学习革命，英伟达也会通过加速计算在分子动力学、地震勘探、计算光刻、量子化学、计算机图形学等领域取得成功，核心逻辑是通用CPU的性能缩放已达瓶颈，领域专用加速是必然趋势。
英伟达GTC大会上有接近一半的内容与AI无关，覆盖科学计算、工业仿真等多个领域，这些非AI业务仍是英伟达的重要组成部分。
英伟达的核心使命是将加速计算普及到全行业， democratize 高性能计算能力，让所有研究人员、开发者都能 access 到高效的计算资源。

💬 精华片段（中文）

"If there were no AI, I would be very sad. But because of the advances that we made in computing, we democratized deep learning. Our mission was really to bring accelerated computing to the world and advance the type of applications that general purpose computing can’t do."

专业术语注释

术语	解释
CUDA（Compute Unified Device Architecture）	英伟达推出的通用并行计算平台和编程模型，允许开发者使用GPU进行通用计算，是英伟达生态的核心基础
TPU（Tensor Processing Unit）	谷歌推出的专用张量处理器，专为AI矩阵运算优化，适用场景相对单一
ASIC（Application Specific Integrated Circuit）	专用集成电路，为特定 workload 定制设计的芯片，通用性差但特定场景下性能/功耗比更高
CoWoS（Chip on Wafer on Substrate）	台积电推出的先进2.5D封装技术，可将多个逻辑芯片与HBM内存集成在同一封装内，是高端AI芯片的核心封装技术
HBM（High Bandwidth Memory）	高带宽内存，专为AI、HPC等场景设计，带宽远高于普通DRAM，是高端AI芯片的核心组件
EUV（Extreme Ultraviolet）	极紫外光刻机，是制造7nm及以下先进工艺芯片的核心设备
TCO（Total Cost of Ownership）	总拥有成本，包含硬件采购、运维、能耗等全生命周期成本，是企业采购算力的核心评估指标
MoE（Mixture of Experts）	混合专家模型，一种大模型架构，通过激活部分专家模块提升模型效率，是当前大模型的主流演进方向之一
KV cache（Key-Value cache）	键值缓存，用于存储大模型推理过程中的中间状态，大幅提升推理速度降低延迟
TTFT（Time to First Token）	首Token生成时间，是衡量大模型推理响应速度的核心指标
vLLM	开源大模型推理框架，主打高吞吐量与低延迟
GDS2（Graphic Design System II）	芯片设计的标准文件格式，是芯片设计公司交付给代工厂的核心生产文件
TSMC（Taiwan Semiconductor Manufacturing Company）	台积电，全球最大的先进工艺芯片代工厂
N3/N2节点	台积电的3nm、2nm先进工艺节点，当前高端AI芯片主要采用N3节点，下一代将采用N2节点
CUDA-X	英伟达推出的领域专用加速库集合，覆盖AI、科学计算、图形学等多个领域
cuLitho	英伟达推出的计算光刻加速库，可将光刻掩模制备速度提升40倍以上
NVLink	英伟达推出的高速GPU互联技术，可实现多GPU之间的高带宽低延迟通信
Spectrum-X	英伟达推出的AI专用以太网交换机，主打AI集群的高带宽低延迟通信
MLPerf	全球权威的AI性能基准测试，用于评估不同AI硬件/软件的性能
Trainium	AWS推出的自研AI训练专用芯片
Blackwell	英伟达2026年推出的最新一代数据中心GPU，相对上一代Hopper性能提升30-50倍
Hopper	英伟达2022年推出的数据中心GPU，是当前大模型训练的主流算力硬件
Ampere	英伟达2020年推出的数据中心GPU，仍广泛应用于推理与中低端训练场景
Feynman	英伟达规划中的下一代GPU架构，预计2028年推出，将采用1.6nm工艺
Vera Rubin	英伟达2026年推出的下一代AI算力集群名称，基于Blackwell GPU构建
Groq	低延迟AI推理芯片厂商，2026年被英伟达收购，用于补充高响应速度推理场景的产品矩阵
Dojo	特斯拉推出的自研AI训练超级计算机，采用大封装专用架构
Cerebras	晶圆级AI芯片厂商，主打超大单芯片面积降低通信延迟

延伸思考

英伟达“做必要且最少的事”的战略与全生态投资逻辑，对科技公司构建长期壁垒有哪些可借鉴之处？如何平衡核心业务投入与生态扶持的关系？
对华AI芯片出口管制的长期影响仍存在较大争议，如何平衡国家安全与产业竞争力的关系，是美国政策制定者需要解决的核心问题。
推理市场分层带来的premium Token需求，是否会成为未来AI算力市场的新增长点？专用低延迟推理芯片的市场空间有多大？
开源模型生态的主导权争夺会成为中美AI竞争的新焦点，如何维持美国技术栈在开源生态中的优势地位，是英伟达等美国科技公司需要应对的长期挑战。
能源瓶颈将成为未来10年AI产业发展的核心制约，核电、可再生能源等低碳能源的布局速度会直接影响AI产业的增长上限。

原文发表：Apr 15, 2026 · 纪要生成：2026-04-20