风险投资vs成长期投资的惨痛教训：Anthropic vs OpenAI、Noam Shazeer、World Labs、Thinking Machines、Cursor、ASIC经济——与a16z的Martin Casado和Sarah Wang对谈

来源： Latent Space（Substack平台） | 嘉宾：Martin Casado（a16z基础设施合伙人）、Sarah Wang（a16z成长期合伙人） | 日期：2026-02-19 播客： Latent Space 分类： 创投 原文发表： Feb 19, 2026 纪要生成： 2026-03-03

全集重点

AI融资新模式：风险投资与成长期投资边界完全模糊，大额融资本质是算力合约，融资可直接快速转化为模型能力。
双路径未来分歧：AI行业要么走向无限碎片化的新软件品类，要么形成少数通用模型寡头吞噬上层全部生态。
人才战争扭曲市场：核心AI人才年薪可达1000万美元，超10亿美元级人才收购打破早期创业公司成本测算逻辑。
被低估的投资机会：传统企业级软件、细分领域专用模型的价值被当前热潮忽略，是稳定的高回报标的。
舆论与现实严重脱节：社交媒体上的AI行业八卦与实际董事会决策差距极大，创始人应聚焦业务减少噪音干扰。

嘉宾/话题简介

Martin Casado是a16z基础设施投资合伙人，软件定义网络的开创者，拥有20年科技创业和投资经验，主导投资了多家前沿AI模型公司。Sarah Wang是a16z成长期投资合伙人，被称为行业顶尖AI模型投资者，主导投资了Character AI、World Labs等多家头部AI创业公司。本次对谈聚焦AI行业全新的融资逻辑、资本飞轮、市场结构走向，以及当前过热赛道和被低估机会的判断，为AI创业者和投资者提供一线决策视角。

分节详述

[00:00:00] 开场：a16z现场录制+嘉宾介绍

本节重点

本次播客在a16z全新办公室现场录制，由Latent Space团队主持
Martin和Sarah是a16z AI投资的核心搭档，覆盖从早期到成长期的全阶段AI投资
Sarah主导了大量前沿大模型公司的投资，是行业内最激进的AI模型投资者之一

详细精要

主持人开场与环境介绍：本次播客在a16z新办公室录制，双方交流了对a16z新品牌标识的看法。
Martin调侃新标识传递了明确的态度，但暂未明确具体含义
主持人提到与Martin早在Netlify时期就有交集，Martin的软件定义网络成果是行业公认的技术里程碑
嘉宾背景介绍：Sarah Wang与Martin搭档7年，是AI成长期投资领域的顶尖投资者。
Martin公开称赞Sarah是全行业最优秀的成长期投资者，主导了包括Noam Shazeer旗下项目、Mira AI、FEI Fey等多家前沿大模型公司的投资
二人采用早期+成长期混合的投资搭档模式，适配当前AI公司的特殊发展节奏

💬 精华片段（中文）

我认为在AI公司领域，Sarah提出了最大胆的投资思路，覆盖了所有前沿大模型赛道。

"I mean, when it comes to AI companies, Sarah, I think has done the most kind of aggressive, um, investment thesis around AI models, right? So, worked for Nom Ja, Mira Ia, FEI Fey, and so just these frontier, kind of like large AI models."

[00:01:20] 前沿模型时代的风险投资vs成长期投资

本节重点

AI大模型公司的融资模式彻底模糊了早期风险投资和成长期投资的边界
大模型公司成立半年就需要谈判数亿美元级别的算力合约，是过往投资从未出现的情况
当前大模型项目普遍未商业化，但用户规模足够大，需要成长期投资的量化分析能力

详细精要

投资阶段边界消失：大模型公司的发展节奏完全打破了传统投资的阶段划分逻辑。
大模型公司往往处于预商业化阶段，但融资额高达数亿甚至数十亿美元，同时用户规模增长极快，需要同时具备早期创始人判断能力和成长期的量化分析能力
传统早期项目不需要的商务拓展、开发者关系团队，大模型公司成立初期就需要搭建，适配其生态建设需求
混合投资模式的必要性：Martin和Sarah的早期+成长期搭档模式完美适配当前AI投资需求。
Sarah提到大模型公司成立初期就需要成长期级别的资源支持，二人的混合团队可以同时覆盖创始人判断、大额交易结构设计、资源对接等全需求
目前头部VC投资大模型公司普遍采用混合团队模式，不再严格划分早期和成长期投资团队

💬 精华片段（中文）

现在这些大额融资非常复杂，过去你做A轮或B轮，开个2000万到6000万美元的支票就完事了，现在你通常要同时对接财务投资者和战略投资者，战略投资部分往往还附带大额算力合约，谈判可能需要数月时间。

"These large rounds are very complex now. Like in the past, if you did a series A or a series B, like whatever, you’re writing a 20 to a $60 million check and you call it a day. Now you normally have financial investors and strategic investors, and then the strategic portion always still goes with like these kind of large compute contracts, which can take months to do."

[00:03:19] 循环融资、需求支撑与“无闲置GPU”

本节重点

当前AI行业不存在算力过剩问题，所有GPU都被充分利用，与互联网泡沫时期的闲置光纤有本质区别
大模型领域首次实现投入资金直接对应能力产出，核心假设是缩放定律持续生效
只要市场对模型能力的需求持续存在，循环融资模式就不会出现泡沫破裂风险

详细精要

循环融资的合理性：AI行业的循环融资与互联网泡沫时期的虚假繁荣有本质区别，核心支撑是真实需求。
互联网泡沫时期大量光纤铺设后没有真实需求，出现了长期供给过剩，而当前AI行业没有Dark GPUs（闲置GPU），所有采购的算力都被充分利用
即使出现短期估值波动，算力供给过剩的情况最多只会持续4年，远低于互联网泡沫后的调整周期
资金与能力的直接映射：AI行业首次实现资金投入直接对应能力产出，是融资逻辑成立的核心基础。
只要缩放定律持续生效，投入的资金就可以转化为明确的模型能力提升，而能力提升必然对应真实的市场需求
传统软件公司的资金主要投入销售和营销，而大模型公司的资金主要投入研发，能力突破后可以快速获得收入回报

💬 精华片段（中文）

这可能是独一无二的时代，我们首次可以直接追踪投入的资金和产出的结果，只要缩放定律持续生效，能力就会不断提升。

"This is probably also a unique time in that. For the first time, you can actually trace dollars to outcomes. Yeah, right. Provided that scaling laws are, are holding, um, and capabilities are actually moving forward."

[00:05:24] 基础设施与应用的边界模糊

本节重点

大模型公司同时具备基础设施和应用的双重属性，传统的科技产业分层逻辑被打破
大模型公司的发展速度远超传统科技公司，成立几年就可以成为生态级平台
大模型公司同时拥有API业务和自有应用业务，与上层应用开发者形成“亦敌亦友”的关系

详细精要

模型公司的双重属性：大模型既是基础设施也是应用，打破了传统的产业分层。
大模型是核心底层技术，是所有上层AI应用的基础，具备典型的基础设施属性
大模型公司同时直接面向C端用户推出ChatGPT、Claude等产品，又具备典型的应用属性
传统产业分层中基础设施和应用是完全独立的赛道，现在的边界已经完全模糊
生态竞争的复杂性：大模型公司同时做API和自有应用，与上层开发者形成复杂的竞合关系。
头部大模型公司的API收入已经达到数十亿美元级别，是大量AI应用公司的核心供应商
大模型公司同时推出自有应用，与上层开发者直接竞争，形成了“亦敌亦友”的特殊生态关系

💬 精华片段（中文）

现在有太多边界被打破或者模糊了，我们已经聊了风险投资和成长期投资的边界模糊，另一个就是基础设施和应用的边界模糊。

"There's so many lines that are being crossed right now, or blurred. Right. So we already talked about venture and growth. Another one that's being blurred is between infrastructure and apps, right?"

[00:06:24] 资本飞轮：融资→训练→发布→融更大的轮

本节重点

AI行业形成了全新的“融资买算力→训练得到能力突破→推出产品获得用户→更高估值融资”的资本飞轮
该飞轮的周转速度按周计算，而传统科技公司的飞轮周转速度按年计算
大模型公司仅需几十人团队就可以在一年内推出能力大幅提升的新模型，完全不受《人月神话》的软件工程效率限制

详细精要

资本飞轮的运作逻辑：AI行业的资本飞轮周转速度远超传统行业。
具体流程为：融资用于采购算力→算力投入训练得到能力突破→能力落地到垂直整合的应用中获取用户和收入→用增长数据支撑更高估值融资，循环往复
该模式在2年前还不存在，现在已经成为所有前沿大模型公司的标准发展路径
软件工程效率的突破：大模型研发完全打破了传统软件工程的效率瓶颈。
传统软件公司融资后需要等待工程师团队逐步开发产品，受《人月神话》限制，人员扩张不会带来线性效率提升，产品迭代周期以年计算
大模型公司仅需10-20人的核心团队，就可以在一年内推出能力大幅提升的新模型，资金投入可以直接快速转化为产品能力，没有传统软件工程的效率瓶颈

💬 精华片段（中文）

这种资金进入公司后立刻产出有需求、有增长的产品，再用增长数据融更多钱的资本飞轮，是我们前所未见的。

"This type of like money entering a company and then producing something that has demand and growth right away and using that to raise more money is a very different capital flywheel than we've ever seen before."

[00:09:39] 前沿实验室能否超过整个应用生态的总投入？

本节重点

前沿大模型公司的融资能力可能超过所有基于其API开发的应用公司的总融资额
如果该情况成立，大模型公司可以凭借资本优势吞噬所有上层应用的市场份额，是科技行业从未出现过的情况
该逻辑本质是“苦涩教训”理论在创业投资领域的延伸，资本投入直接决定竞争胜负

详细精要

超生态融资的可能性：头部大模型公司的融资增长速度远快于上层应用生态的总规模增长。
以Anthropic为例，其每一轮融资额都可以达到上一轮的3倍，长期来看其融资总额可能超过所有基于其API开发的应用公司的总融资额
如果该情况成立，Anthropic可以凭借资本优势进入所有上层应用赛道，凭借更底层的模型能力和资金补贴抢夺市场份额，最终吞噬整个上层生态
行业结构的颠覆性变化：这种超生态融资的情况如果成立，将彻底颠覆传统科技行业的分层价值分配逻辑。
传统科技行业中，基础设施层、平台层、应用层分别由不同的公司主导，各层都可以积累大量价值
如果大模型公司可以通过超生态融资吞噬上层生态，未来整个AI行业的价值将几乎全部被底层大模型寡头获取

💬 精华片段（中文）

这几乎就是“苦涩教训”理论应用到创业行业，只要你能持续融资，直接把资金转化为增长，再用增长融3倍的钱，你就可以超过所有上层公司的总投入，拿走他们的市场份额，这太疯狂了。

"It is almost like bitter lesson applied to the startup industry. Yeah, a hundred percent. It literally becomes an issue of like raise capital, turn that directly into growth. Use that to raise three times more. Exactly. And if you can keep doing that, you literally can outspend the aggregate of companies on top of you and therefore you'll necessarily take their share, which is crazy."

[00:11:24] Character AI与AGI vs产品的两难困境

本节重点

Character AI的核心矛盾是创始人Noam Shazeer的AGI长期目标和短期产品商业化的资源分配冲突
前沿大模型公司普遍面临GPU资源分配的两难：是投入长期AGI研究，还是投入短期产品迭代获取收入
大模型创始人的目标导向与传统科技创始人有本质区别，很多人创业的核心目标是实现AGI，而非打造商业公司

详细精要

Character AI案例复盘：Noam Shazeer创立Character AI的核心目标是实现AGI，产品只是获取数据和收入的载体。
a16z在2023年1月投资Character AI，2024年8月Noam Shazeer与Google达成IP授权协议回归Google，核心原因是Google允许他投入全部资源做AGI研究
Character AI的产品已经积累了大量用户和数据，本可以成为独立的消费AI巨头，但创始人的个人目标优先于商业公司发展
GPU资源分配的普遍矛盾：所有前沿大模型公司都面临长期研究和短期产品的资源分配冲突。
GPU是稀缺资源，分配给短期产品迭代可以快速获得收入，支撑后续融资；分配给长期AGI研究则可能在未来获得更大的技术优势，但短期没有回报
OpenAI、Anthropic等头部公司都已经面临该矛盾，随着模型训练成本越来越高，该矛盾会越来越突出
创始人目标的特殊性：AI大模型创始人的目标与传统科技创始人有本质区别。
传统科技创始人的目标大多是打造成功的商业公司，而大模型创始人很多是以实现AGI为统一的北极星目标
这种目标差异导致AI行业的创始人流动率远高于传统科技行业，类似半导体行业初期肖克利实验室和“八叛逆”的时期

💬 精华片段（中文）

世界上最优秀的研究者都面临这样的两难：我想全力投入AGI研究，但只有产品使用和收入的飞轮才能赚够钱买GPU支持AGI研发。

"The best researchers in the world have this dilemma of, okay, I wanna go all in on a GI, but it's the product usage revenue flywheel that keeps the revenue in the house to power all the GPUs to get to a GI."

[00:14:39] 人才战争、1000万美元年薪的工程师与创始人焦虑

本节重点

当前AI行业核心人才的薪酬达到历史最高水平，L5级工程师就可以拿到数千万美元的年薪，顶级人才的收购价格可达50亿美元
高额薪酬打破了早期创业公司的成本测算逻辑，很多人才选择拿高薪而非创业
AI行业的人才收购（Acqui-hire）规模创下历史新高，对VC来说是不错的早期退出渠道

详细精要

人才薪酬的通胀程度：AI核心人才的薪酬已经达到了历史上前所未有的水平。
Meta在2025年的人才抢夺战中将行业薪酬水平大幅拉高，现在顶级AI研究者的年薪可达1000万美元，普通L5级工程师也可以拿到数千万美元的offer
顶级团队的人才收购价格可达10亿美元以上，远超传统科技行业的人才收购价格
对早期创业的影响：高额薪酬扭曲了早期创业的激励机制。
传统科技行业中，优秀人才选择创业的预期回报远高于打工薪酬，现在很多人才选择拿高薪而非创业，打破了早期创业的人才供给逻辑
同时，AI行业的人才收购规模创下历史新高，很多早期项目最终以人才收购的方式退出，对VC来说是不错的回报，整体来看对投资的影响偏正向
创始人的舆论压力：AI创始人处于舆论的聚光灯下，任何风吹草动都会被媒体放大，加剧了创始人的焦虑。
现在AI行业的任何负面消息都会在几小时内传遍整个行业，创始人需要同时应对业务竞争和舆论噪音，压力远大于传统行业创始人

💬 精华片段（中文）

如果你是一个AI创始人，哪怕你只是随便做了点小事，都可能登上《The Information》的头版，这种鱼缸效应加剧了AI创始人的深度焦虑。

"If you're a founder in ai, you could fart and it would be on the front page of, you know, the information these days. And so there's [00:15:00] sort of this fishbowl effect that I think adds to the deep anxiety that, that these AI founders are feeling."

[00:17:33] 被低估的投资机会：“无聊”的企业级软件

本节重点

当前风险投资的热钱全部聚焦在AI大模型等热点赛道，传统企业级软件的投资价值被严重低估
年增长5倍的传统企业级软件是非常优秀的投资标的，完全可以满足LP的回报要求
当前投资圈的浮躁风气导致大家只关注一年内从零增长到百亿美元的项目，忽略了稳定增长的优质企业软件项目

详细精要

被忽略的优质赛道：传统企业级软件是当前最被低估的投资方向。
现在热钱全部聚焦在大模型、生成式AI等热点赛道，数据库、监控、日志、开发工具等传统企业软件项目很难获得投资者关注
只要这些项目在大市场中保持年增长5倍，就是非常优秀的投资标的，完全可以满足LP要求的3倍以上净回报要求
投资圈的浮躁风气：当前投资圈形成了“不增长100倍就不算好项目”的错误共识，扭曲了投资逻辑。
很多投资者认为如果项目不能在一年内从零增长到百亿美元规模就不值得投资，这种判断完全不符合正常的商业规律
传统企业软件项目虽然增长速度没有大模型快，但利润率高、壁垒强、生命周期长，长期来看回报并不比热点赛道低

💬 精华片段（中文）

现在大家都有种愚蠢的共识：如果你不能一年从零增长到100，你就不够有意思，这简直是最荒谬的说法。

"It's almost become a meme, right? Which is like, if you're not basically growing from zero to a hundred in a year, you're not interesting, which is just, is the silliest thing to say."

[00:19:29] 机器人、硬件与难以落地的痛点

本节重点

机器人行业还没有迎来自己的ChatGPT时刻，当前的投资热度已经超过了技术成熟度
大部分机器人公司都是垂直领域的，核心竞争力是对应用场景的理解，而非通用机器人技术
a16z的通用科技投资团队暂时不会大规模布局机器人赛道，该赛道更适合懂垂直行业的美国动力（AD）团队投资

详细精要

机器人行业的成熟度判断：机器人行业还没有出现通用性的技术突破，当前的投资热度偏高。
2024-2025年机器人行业获得了大量投资，但还没有出现类似ChatGPT的通用性技术突破，大部分应用都停留在垂直场景的试点阶段
特斯拉的人形机器人项目可能会带动整个行业的发展，吸引更多资本和人才进入，但短期来看通用性机器人落地还为时尚早
机器人投资的特殊性：机器人项目的核心壁垒是场景理解，而非通用技术，需要行业专属的投资能力。
农业机器人公司本质是农业公司，采矿机器人公司本质是采矿公司，核心竞争力是对下游场景的理解、供应链整合和客户资源，而非机器人技术本身
a16z的通用科技投资团队缺乏垂直行业的研究能力，因此暂时不会大规模布局机器人赛道，该赛道由聚焦硬科技和产业投资的美国动力（AD）团队覆盖

💬 精华片段（中文）

我们非常相信机器人时代终会到来，但我们不觉得自己有能力做好这些项目的尽调，因为机器人公司往往是垂直的，你必须真正理解它们的下游市场。

"We're a huge believer that this is gonna happen. We just don't feel like we're in a good position to diligence these things. 'cause again, robotics companies tend to be vertical. You really have to understand the market they're being sold into."

[00:22:42] 定制ASIC与10亿美元训练跑次的经济账

本节重点

当单轮大模型训练成本达到10亿美元级别时，为该模型定制专用ASIC芯片已经具备经济合理性
定制ASIC相比通用GPU可以节省至少20%的训练和推理成本，10亿美元级训练跑次可以节省2亿美元，足够覆盖ASIC流片成本
OpenAI已经在和博通等公司合作开发定制芯片，验证了该逻辑的可行性

详细精要

定制ASIC的经济阈值：10亿美元级训练跑次是定制ASIC的盈亏平衡点。
假设单轮训练成本为10亿美元，对应的推理成本至少也会达到10亿美元，合计总算力成本为20亿美元
定制ASIC相比通用GPU可以至少节省20%的算力成本，也就是4亿美元，而先进工艺芯片的流片成本仅为2亿美元左右，完全可以覆盖
如果考虑ASIC可以带来的2-3倍效率提升，节省的成本会更高，经济价值更加明显
行业趋势验证：头部大模型公司已经开始布局定制芯片。
OpenAI已经确认在和博通等公司合作开发定制AI芯片，2025年已经投入使用，验证了该逻辑的可行性
未来头部大模型公司每推出一代新模型，都可能同步开发对应的定制ASIC芯片，进一步降低算力成本

💬 精华片段（中文）

10亿美元级别的训练跑次，只要你能按时完成开发，做定制ASIC完全是合理的，现在问题主要是开发周期，而不是成本。

"A billion dollar training run of $1 billion training run. It makes sense to actually do a custom meic if you can do it in time. The question now is timelines. Yeah, but not money."

[00:24:23] 美国动力、地理分布与AI权力中心

本节重点

a16z的美国动力（AD）团队本质是面向硬科技、监管相关、政府采购类项目的市场细分团队，而非单纯的意识形态导向
湾区已经重新成为AI行业的绝对中心，之前Crypto、Web3带来的人才外流已经完全逆转
a16z的投资布局优先聚焦湾区，其次是美国本土，再其次是美国盟友国家，核心是利用本地网络的积累优势

详细精要

美国动力团队的定位：AD团队是a16z面向硬科技和产业项目的专属投资团队。
AD团队覆盖的项目大多涉及监管合规、政府采购、硬件制造等领域，需要专门的行业研究能力和政府资源，与普通科技投资的能力要求不同
AD团队的存在是市场细分的结果，而非单纯的意识形态导向，旨在提升硬科技项目的尽调和投后服务能力
AI行业的地理分布：湾区已经重新成为AI行业的绝对权力中心。
新冠疫情和Crypto热潮期间，大量人才从湾区流向迈阿密、纽约、洛杉矶等地，现在几乎全部回流到湾区
湾区的人才、资本、生态聚集效应非常明显，创业公司的成功概率远高于其他地区，因此a16z的投资仍然以湾区为核心

💬 精华片段（中文）

地理偏向有很强的复利效应，所有人都在同一个地方，你有成熟的生态、存在感和网络，投资效率会高很多。

"There's actually a lot of compounding effects for having a geographic bias. Right. You know, everybody's in the same place. You've got an ecosystem, you're there, you've got presence, you've got a network."

[00:26:48] AI如何改变投资者工作流：Claude Cowork的价值

本节重点

Claude Cowork已经成为成长期投资者的核心效率工具，可以自动完成数据分析、用户留存分析等之前需要手动完成的工作
投资者的核心工作仍然是网络资源对接，这部分暂时无法被AI替代
Claude Cowork可以在几秒内完成之前需要熬夜几小时的 cohort留存分析，准确率完全达标

详细精要

AI对投资者工作的赋能：Claude Cowork大幅提升了成长期投资者的数据分析效率。
Sarah团队实测Claude Cowork可以自动处理原始用户数据，输出准确的 cohort留存分析报告，之前需要熬夜几小时完成的工作现在几秒就可以完成，准确率完全符合要求
该工具是Anthropic针对企业用户场景推出的核心产品，已经成为很多投资机构的标配工具
不可替代的投资者核心能力：网络资源对接、交易结构设计、创始人判断等核心工作暂时无法被AI替代。
投资者的核心价值在于为创业公司对接合适的资源、提供行业经验、设计合理的交易结构，这些依赖长期积累的网络和经验，暂时无法被AI替代
AI更多是作为效率工具，替代重复性的数据分析工作，让投资者有更多时间聚焦核心决策

💬 精华片段（中文）

有次半夜我们三个人在玩Claude Cowork，给了它一份原始数据， boom，输出的结果完全准确，我们核对了数字，太神奇了，这就是我的“啊哈”时刻。

"Our team, the other, it was like midnight and the three of us were playing with Claude Cowork. We gave it a raw file. Boom. Perfectly accurate. We checked the numbers. It was amazing. That was my like, aha moment."

[00:29:12] AI的两个未来：无限扩张 vs 寡头垄断

本节重点

AI行业未来存在两种完全相反的可能性，目前还无法判断最终走向
第一种可能是市场无限碎片化，出现大量全新的软件品类，大量公司都可以获得增长空间
第二种可能是少数通用模型寡头垄断整个市场，凭借资本和技术优势吞噬所有上层应用的份额

详细精要

未来一：无限碎片化：AI技术扩散后，大量垂直领域的新软件品类出现，市场极度分散。
模型技术会快速扩散，不同领域的专用模型会不断涌现，传统软件会被全面AI重构，出现大量全新的软件品类
这种情况下市场会非常碎片化，大量创业公司都可以获得生存空间，类似过去20年互联网行业的发展路径
未来二：寡头垄断：少数通用模型寡头凭借资本和技术优势，吞噬整个上层生态的价值。
通用大模型的能力会越来越强，只要投入3倍的资金训练就可以覆盖所有应用场景，不需要垂直领域的专用模型
这种情况下整个行业会形成3-5家通用模型寡头垄断的格局，几乎所有价值都会被底层模型公司获取，上层应用很难独立生存
当前的判断难点：行业格局还在快速变化，没有明确的收敛方向。
2024年3月几乎每天都有新的开源SOTA模型发布，当时大家普遍认为开源会主导市场，走向碎片化
2025-2026年头部闭源模型的优势重新拉大，大家又普遍认为会走向寡头垄断，说明行业格局还远未稳定

💬 精华片段（中文）

对我来说整个行业的未来就像那个站在岔路口的 meme，一条路是无限扩张的巨大市场，另一条路是通用模型寡头垄断一切，没人知道最终会走向哪一边。

"For me, like, like all the entire industry kind of like hinges on like two potential futures. So in, in one potential future, um, the market is infinitely large... And then there's another path which is like, well. Maybe these models actually generalize really well... you end up with basically an oligopoly for everything."

[00:32:48] 如果你能融到比整个生态还多的钱，你就赢了

本节重点

即使通用模型没有实现完全的AGI能力，只要大模型公司能融到比上层应用生态总规模还多的钱，就可以吞噬所有上层市场
大模型公司可以通过API数据清晰看到上层应用的需求和规模，凭借资本优势快速跟进对应的功能
对于已经饱和的垂直领域，价值会向服务、实施等非模型环节转移，仍然有创业机会

详细精要

资本作为竞争武器的逻辑：资本优势可以弥补技术差距，帮助大模型公司吞噬上层市场。
大模型公司的API业务利润率可达60%-80%，同时可以清晰看到所有上层应用的使用数据，知道哪些需求有市场
只要大模型公司的融资能力超过所有上层应用的总融资额，就可以投入足够的资源开发对应的功能，凭借更底层的模型优势和价格补贴抢夺市场，不需要具备完全的AGI能力
饱和领域的创业机会：对于模型能力已经饱和的垂直领域，仍然有大量创业机会。
很多企业场景的模型能力已经足够好用，边际提升的价值不大，此时价值会向场景理解、实施服务、客户资源等非模型环节转移
法律、医疗、客户支持等领域已经出现了很多这类专注场景落地的创业公司，回报非常可观

💬 精华片段（中文）

如果你能融到比所有使用你模型的公司的总融资额还多的钱，那么你是不是AGI根本不重要，你会把他们全部吃掉。

"If you can raise more than the aggregate of anybody that uses your models, that doesn't even matter. It doesn't [00:33:00] even matter. See what I'm saying?"

[00:34:27] 所有任务都是AGI完整的吗？编码作为测试案例

本节重点

编码任务本质上是AGI完整的，不仅需要写代码的能力，还需要理解需求、沟通、知识检索等通用能力
不存在纯粹的“专用编码模型”，编码能力强的模型必然需要具备较强的通用推理能力
OpenAI的模型分为两类：一类侧重推理能力，一类侧重交互体验，适配不同的使用场景

详细精要

编码任务的AGI属性：编码不仅仅是写代码，还需要大量通用能力。
开发者使用AI编码工具时，不仅需要模型生成代码，还需要模型理解复杂需求、排查错误、检索相关知识、进行多轮沟通，这些都需要通用推理能力
之前大量创业公司推出的专用编码模型都没有成功，核心原因就是缺乏通用能力，无法满足实际编码场景的需求
模型能力的分化：大模型正在向两个方向分化，适配不同场景。
一类模型侧重推理能力，适合解决复杂的技术问题，比如OpenAI的Codex系列，编码能力超过通用版GPT
另一类模型侧重交互体验，有更好的“沟通感”，适合作为 brainstorming伙伴，比如Anthropic的Claude Opus系列

💬 精华片段（中文）

关于这个话题最被低估的一点是：到底有多少任务本质上是AGI完整的？我每天都写代码，非常清楚编码任务不仅仅是代码，它涉及一切。

"One more thing I think is, is underused in all of this is like, to what extent every task is a GI complete. Yeah. I code every day. It's so fun. And like. When I'm talking to these models, it's not just code. I mean, it's everything, right?"

[00:38:55] Cursor与应用层的力量

本节重点

Cursor是应用层公司向下渗透做模型的成功案例，仅用头部大模型1%的成本就开发出了顶级的编码模型
Cursor的路径是先做应用积累用户和数据，再向下自研模型，既可以提升利润率，也可以避免被底层卡脖子
每个垂直领域都可能出现类似Cursor的公司，先占据应用场景，再向下布局自研模型

详细精要

Cursor的成功路径：从应用层向下做模型，走出了差异化的竞争路线。
Cursor最初是基于OpenAI API开发的编码编辑器，积累了数百万专业开发者用户和大量编码数据
随后Cursor投入少量资源自研编码模型，在一段时间内成为全球最受欢迎的编码模型，证明了应用层公司向下做模型的可行性
这种路径的成本仅为头部大模型公司的1%左右，投入产出比非常高
对应用层公司的启示：所有头部应用层公司都应该考虑向下布局自研模型，提升利润率。
应用层公司如果完全依赖第三方API，利润率会被底层模型公司挤压，自研模型可以大幅提升利润率
应用层公司有场景和数据优势，做垂直领域的专用模型的效率远高于通用大模型公司，竞争优势明显

💬 精华片段（中文）

Cursor最有意思的地方是，他们只用了不到头部大模型1%的成本，就开发出了几乎是SOTA级别的模型，一度是全球最受欢迎的编码模型，这太疯狂了。

"The interesting about cursors, they actually for, you know, a small fraction of the cost, a hundred of the costs or less. Developed an almost soda model, which for a period of time was the most popular coding model in the world. Right? Which is really crazy to think about."

[00:44:05] World Labs、空间智能与3D基础模型

本节重点

World Labs正在开发3D场景生成基础模型，可以将3D内容的边际成本降低3-5个数量级
语言模型天生不适合处理空间推理任务，需要专门的3D模型来实现空间智能
3D内容成本的大幅下降会颠覆游戏、影视、工业设计等多个行业，市场空间非常大

详细精要

World Labs的技术价值：将3D场景生成的成本降低3-5个数量级。
目前专业级的3D场景制作成本高达3万-10万美元/场景，而用生成式3D模型可以将成本降低到1美元以下，边际成本几乎为零
3D场景的需求非常大，游戏、影视、工业设计、建筑、VR/AR等行业都需要大量3D内容，成本下降会释放巨大的市场需求
空间智能的特殊性：语言模型无法替代专门的3D模型实现空间推理。
人类大脑的语言推理和空间推理是两个独立的模块，AI也是一样，语言模型天生不适合处理距离、形状、位置等空间信息
生成式3D模型不需要用户环绕拍摄大量图片，仅用单张2D图片就可以生成完整的3D场景，包括看不到的背面部分，这是传统NeRF技术做不到的
Martin的个人参与：Martin正在参与开发开源3D渲染库Spark.js，弥补高斯泼溅技术的生态短板。
生成式3D的主流技术是高斯泼溅，而当前的3D渲染生态主要支持传统网格模型，对高斯泼溅的支持不足
Martin和读博时期的同学一起开发Spark.js，作为JavaScript环境下的高斯泼溅渲染库，支持World Labs的3D模型落地

💬 精华片段（中文）

如果你能把有用的东西的边际成本降低3个数量级，历史上这种情况都会催生出非常大的公司。

"If you could do that for. You know, less than a dollar, that's four or five orders of magnitude cheaper. So you're bringing the marginal cost of something that's useful down by three orders of magnitude, which historically have created very large companies."

[00:47:20] Thinking Machines、创始人 drama与媒体叙事

本节重点

Thinking Machines虽然之前出现了创始人分裂的传闻，但a16z仍然非常看好，2026年将会有重大进展
当前社交媒体上的AI行业八卦与真实情况差距极大，很多传闻都是完全失真的
创始人应该埋头聚焦业务，不要被舆论噪音干扰，Cursor团队就是很好的正面案例

详细精要

Thinking Machines的现状：团队已经恢复正常运营，2026年将有重大产品发布。
之前的创始人分裂传闻被媒体大幅夸大，实际影响远小于报道
团队已经解决了内部问题，正在推进核心技术研发，2026年将会有重大进展，a16z对其的信心比之前更强
舆论与现实的脱节：社交媒体上的AI行业传闻大多严重失真。
Martin表示，作为多家头部AI公司的董事会成员，他观察到当前社交媒体上的八卦与真实情况的差距是史上最大的，很多传闻完全是捕风捉影，经过多轮传播后已经和事实完全不符
很多匿名账号发布的消息看起来非常确定，但实际上完全没有事实依据，已经到了非常荒谬的程度
对创始人的建议：聚焦业务，忽略噪音。
创始人不需要关注社交媒体上的传闻，应该像Cursor团队一样埋头做业务，用产品和增长回应噪音
现在舆论噪音已经成为创始人的额外负担，需要学会过滤无效信息，专注核心业务

💬 精华片段（中文）

我可以保证，任何你在X上看到的八卦消息，和真实情况的差距都非常非常大，完全是被严重扭曲的。

"I guarantee you, for any of these gossipy things, I guarantee you it's way off. Way, way off. Like, like the general sentiment and like, and what happens is like we've got this crazy game of telephone right now where there's always. Seeds of truth, but it gets so warped by the time, like we hear all the time rumors about stuff that we're directly involved in."

[00:52:30] AI栈的长期价值累积位置

本节重点

AI行业的价值累积位置还远未确定，底层模型、应用层、中间层都有可能获得大量价值
应用层公司如果能占据场景和用户，向下布局模型，可以获得很高的利润率
大模型公司与上层应用的竞争将会长期存在，类似过去云厂商与SaaS公司的竞合关系

详细精要

价值累积的不确定性：当前AI行业的价值分配格局还远未稳定。
传统科技行业的价值分配是基础设施层占10%，平台层占20%，应用层占70%，但AI行业的分配逻辑可能完全不同
如果走向寡头垄断格局，底层模型公司可能拿走70%以上的价值；如果走向碎片化格局，应用层公司可能拿走大部分价值
竞合关系的长期存在：大模型公司与上层应用的竞合关系会长期存在，类似过去云厂商和SaaS公司的关系。
过去云厂商也会推出自有SaaS产品，与上层客户竞争，但最终大部分价值还是被SaaS公司获取
AI行业的竞合关系会更复杂，但应用层公司只要做好场景和用户体验，仍然有很大的生存空间

💬 精华片段（中文）

我们在董事会有非常特殊的位置，我从来没见过公众认知和真实情况的差距像现在这么大，全行业都是如此。

"I will say this is the furthest, so we have a very privileged position on the boards of these companies, and like I'll say, I've never seen. The perception of the truth be further from the truth. Industry wide ever."

专业术语注释

术语	解释
ASIC（Application Specific Integrated Circuit）	专用集成电路，本集中特指为大模型训练/推理定制的芯片，相比通用GPU可大幅提升效率降低成本
AGI（Artificial General Intelligence）	通用人工智能，指具备和人类同等的通用认知和解决问题能力的人工智能系统，是当前前沿大模型公司的核心目标之一
Gaussian Splat（高斯泼溅）	一种3D场景渲染技术，相比传统网格模型能更高效地生成高真实感的3D场景，是当前生成式3D领域的主流技术路径之一
MFU（Model Flops Utilization）	模型浮点运算利用率，衡量大模型训练/推理过程中芯片算力被有效利用的比例，行业平均水平约为50%
a16z AD Team（American Dynamism Team）	a16z旗下的美国动力投资团队，聚焦投资涉及监管、政府采购、硬件制造等领域的硬科技和产业项目
NeRF（Neural Radiance Field）	神经辐射场，一种通过2D图像重建3D场景的技术，需要多角度拍摄大量图像才能完成重建
scaling laws（缩放定律）	大模型领域的核心规律，指模型能力随训练数据量、参数量、算力投入的增加呈可预测的线性/对数增长，是当前AI融资逻辑的核心假设
Dark GPUs	闲置GPU，指已经采购但未被投入实际使用的GPU算力，本集中提到当前AI行业没有闲置GPU，所有算力都被充分利用，不存在供给过剩
Acqui-hire	人才收购，指收购公司的核心目的是获取创始团队和核心人才，而非产品或业务，本集中提到当前AI行业人才收购金额创下历史新高
Cohort Retention	群体留存，即用户分群留存分析，是成长期投资者衡量SaaS公司健康度的核心指标之一，本集中提到Claude Cowork可以自动完成该分析

延伸思考

大模型公司的资本飞轮是否可持续？如果后续融资无法覆盖下一轮训练成本，行业是否会出现大规模洗牌？
应用层公司是否应该向下布局自研模型？Cursor的路径是否具备可复制性，适合所有细分赛道的头部应用？
生成式3D的ChatGPT时刻何时到来？3D内容成本的大幅下降会首先颠覆哪些行业？
创始人如何平衡AGI长期研究和短期商业化的资源分配，避免陷入Character AI类似的困境？
中国AI公司在当前美国主导的算力和人才格局下，有哪些差异化的竞争机会？

原文发表：Feb 19, 2026 · 纪要生成：2026-03-03