来源: Latent Space(Substack平台) | 嘉宾:Martin Casado(a16z基础设施合伙人)、Sarah Wang(a16z成长期合伙人) | 日期:2026-02-19 分类: Anthropic 原文发表: Feb 19, 2026 纪要生成: 2026-03-03
Martin Casado是a16z基础设施投资合伙人,软件定义网络的开创者,拥有20年科技创业和投资经验,主导投资了多家前沿AI模型公司。Sarah Wang是a16z成长期投资合伙人,被称为行业顶尖AI模型投资者,主导投资了Character AI、World Labs等多家头部AI创业公司。本次对谈聚焦AI行业全新的融资逻辑、资本飞轮、市场结构走向,以及当前过热赛道和被低估机会的判断,为AI创业者和投资者提供一线决策视角。
本节重点 - 本次播客在a16z全新办公室现场录制,由Latent Space团队主持 - Martin和Sarah是a16z AI投资的核心搭档,覆盖从早期到成长期的全阶段AI投资 - Sarah主导了大量前沿大模型公司的投资,是行业内最激进的AI模型投资者之一
详细精要
主持人提到与Martin早在Netlify时期就有交集,Martin的软件定义网络成果是行业公认的技术里程碑
嘉宾背景介绍:Sarah Wang与Martin搭档7年,是AI成长期投资领域的顶尖投资者。
💬 精华片段(中文)
我认为在AI公司领域,Sarah提出了最大胆的投资思路,覆盖了所有前沿大模型赛道。
"I mean, when it comes to AI companies, Sarah, I think has done the most kind of aggressive, um, investment thesis around AI models, right? So, worked for Nom Ja, Mira Ia, FEI Fey, and so just these frontier, kind of like large AI models."
本节重点 - AI大模型公司的融资模式彻底模糊了早期风险投资和成长期投资的边界 - 大模型公司成立半年就需要谈判数亿美元级别的算力合约,是过往投资从未出现的情况 - 当前大模型项目普遍未商业化,但用户规模足够大,需要成长期投资的量化分析能力
详细精要
传统早期项目不需要的商务拓展、开发者关系团队,大模型公司成立初期就需要搭建,适配其生态建设需求
混合投资模式的必要性:Martin和Sarah的早期+成长期搭档模式完美适配当前AI投资需求。
💬 精华片段(中文)
现在这些大额融资非常复杂,过去你做A轮或B轮,开个2000万到6000万美元的支票就完事了,现在你通常要同时对接财务投资者和战略投资者,战略投资部分往往还附带大额算力合约,谈判可能需要数月时间。
"These large rounds are very complex now. Like in the past, if you did a series A or a series B, like whatever, you’re writing a 20 to a $60 million check and you call it a day. Now you normally have financial investors and strategic investors, and then the strategic portion always still goes with like these kind of large compute contracts, which can take months to do."
本节重点 - 当前AI行业不存在算力过剩问题,所有GPU都被充分利用,与互联网泡沫时期的闲置光纤有本质区别 - 大模型领域首次实现投入资金直接对应能力产出,核心假设是缩放定律持续生效 - 只要市场对模型能力的需求持续存在,循环融资模式就不会出现泡沫破裂风险
详细精要
即使出现短期估值波动,算力供给过剩的情况最多只会持续4年,远低于互联网泡沫后的调整周期
资金与能力的直接映射:AI行业首次实现资金投入直接对应能力产出,是融资逻辑成立的核心基础。
💬 精华片段(中文)
这可能是独一无二的时代,我们首次可以直接追踪投入的资金和产出的结果,只要缩放定律持续生效,能力就会不断提升。
"This is probably also a unique time in that. For the first time, you can actually trace dollars to outcomes. Yeah, right. Provided that scaling laws are, are holding, um, and capabilities are actually moving forward."
本节重点 - 大模型公司同时具备基础设施和应用的双重属性,传统的科技产业分层逻辑被打破 - 大模型公司的发展速度远超传统科技公司,成立几年就可以成为生态级平台 - 大模型公司同时拥有API业务和自有应用业务,与上层应用开发者形成“亦敌亦友”的关系
详细精要
传统产业分层中基础设施和应用是完全独立的赛道,现在的边界已经完全模糊
生态竞争的复杂性:大模型公司同时做API和自有应用,与上层开发者形成复杂的竞合关系。
💬 精华片段(中文)
现在有太多边界被打破或者模糊了,我们已经聊了风险投资和成长期投资的边界模糊,另一个就是基础设施和应用的边界模糊。
"There's so many lines that are being crossed right now, or blurred. Right. So we already talked about venture and growth. Another one that's being blurred is between infrastructure and apps, right?"
本节重点 - AI行业形成了全新的“融资买算力→训练得到能力突破→推出产品获得用户→更高估值融资”的资本飞轮 - 该飞轮的周转速度按周计算,而传统科技公司的飞轮周转速度按年计算 - 大模型公司仅需几十人团队就可以在一年内推出能力大幅提升的新模型,完全不受《人月神话》的软件工程效率限制
详细精要
该模式在2年前还不存在,现在已经成为所有前沿大模型公司的标准发展路径
软件工程效率的突破:大模型研发完全打破了传统软件工程的效率瓶颈。
💬 精华片段(中文)
这种资金进入公司后立刻产出有需求、有增长的产品,再用增长数据融更多钱的资本飞轮,是我们前所未见的。
"This type of like money entering a company and then producing something that has demand and growth right away and using that to raise more money is a very different capital flywheel than we've ever seen before."
本节重点 - 前沿大模型公司的融资能力可能超过所有基于其API开发的应用公司的总融资额 - 如果该情况成立,大模型公司可以凭借资本优势吞噬所有上层应用的市场份额,是科技行业从未出现过的情况 - 该逻辑本质是“苦涩教训”理论在创业投资领域的延伸,资本投入直接决定竞争胜负
详细精要
如果该情况成立,Anthropic可以凭借资本优势进入所有上层应用赛道,凭借更底层的模型能力和资金补贴抢夺市场份额,最终吞噬整个上层生态
行业结构的颠覆性变化:这种超生态融资的情况如果成立,将彻底颠覆传统科技行业的分层价值分配逻辑。
💬 精华片段(中文)
这几乎就是“苦涩教训”理论应用到创业行业,只要你能持续融资,直接把资金转化为增长,再用增长融3倍的钱,你就可以超过所有上层公司的总投入,拿走他们的市场份额,这太疯狂了。
"It is almost like bitter lesson applied to the startup industry. Yeah, a hundred percent. It literally becomes an issue of like raise capital, turn that directly into growth. Use that to raise three times more. Exactly. And if you can keep doing that, you literally can outspend the aggregate of companies on top of you and therefore you'll necessarily take their share, which is crazy."
本节重点 - Character AI的核心矛盾是创始人Noam Shazeer的AGI长期目标和短期产品商业化的资源分配冲突 - 前沿大模型公司普遍面临GPU资源分配的两难:是投入长期AGI研究,还是投入短期产品迭代获取收入 - 大模型创始人的目标导向与传统科技创始人有本质区别,很多人创业的核心目标是实现AGI,而非打造商业公司
详细精要
Character AI的产品已经积累了大量用户和数据,本可以成为独立的消费AI巨头,但创始人的个人目标优先于商业公司发展
GPU资源分配的普遍矛盾:所有前沿大模型公司都面临长期研究和短期产品的资源分配冲突。
OpenAI、Anthropic等头部公司都已经面临该矛盾,随着模型训练成本越来越高,该矛盾会越来越突出
创始人目标的特殊性:AI大模型创始人的目标与传统科技创始人有本质区别。
💬 精华片段(中文)
世界上最优秀的研究者都面临这样的两难:我想全力投入AGI研究,但只有产品使用和收入的飞轮才能赚够钱买GPU支持AGI研发。
"The best researchers in the world have this dilemma of, okay, I wanna go all in on a GI, but it's the product usage revenue flywheel that keeps the revenue in the house to power all the GPUs to get to a GI."
本节重点 - 当前AI行业核心人才的薪酬达到历史最高水平,L5级工程师就可以拿到数千万美元的年薪,顶级人才的收购价格可达50亿美元 - 高额薪酬打破了早期创业公司的成本测算逻辑,很多人才选择拿高薪而非创业 - AI行业的人才收购(Acqui-hire)规模创下历史新高,对VC来说是不错的早期退出渠道
详细精要
顶级团队的人才收购价格可达10亿美元以上,远超传统科技行业的人才收购价格
对早期创业的影响:高额薪酬扭曲了早期创业的激励机制。
同时,AI行业的人才收购规模创下历史新高,很多早期项目最终以人才收购的方式退出,对VC来说是不错的回报,整体来看对投资的影响偏正向
创始人的舆论压力:AI创始人处于舆论的聚光灯下,任何风吹草动都会被媒体放大,加剧了创始人的焦虑。
💬 精华片段(中文)
如果你是一个AI创始人,哪怕你只是随便做了点小事,都可能登上《The Information》的头版,这种鱼缸效应加剧了AI创始人的深度焦虑。
"If you're a founder in ai, you could fart and it would be on the front page of, you know, the information these days. And so there's [00:15:00] sort of this fishbowl effect that I think adds to the deep anxiety that, that these AI founders are feeling."
本节重点 - 当前风险投资的热钱全部聚焦在AI大模型等热点赛道,传统企业级软件的投资价值被严重低估 - 年增长5倍的传统企业级软件是非常优秀的投资标的,完全可以满足LP的回报要求 - 当前投资圈的浮躁风气导致大家只关注一年内从零增长到百亿美元的项目,忽略了稳定增长的优质企业软件项目
详细精要
只要这些项目在大市场中保持年增长5倍,就是非常优秀的投资标的,完全可以满足LP要求的3倍以上净回报要求
投资圈的浮躁风气:当前投资圈形成了“不增长100倍就不算好项目”的错误共识,扭曲了投资逻辑。
💬 精华片段(中文)
现在大家都有种愚蠢的共识:如果你不能一年从零增长到100,你就不够有意思,这简直是最荒谬的说法。
"It's almost become a meme, right? Which is like, if you're not basically growing from zero to a hundred in a year, you're not interesting, which is just, is the silliest thing to say."
本节重点 - 机器人行业还没有迎来自己的ChatGPT时刻,当前的投资热度已经超过了技术成熟度 - 大部分机器人公司都是垂直领域的,核心竞争力是对应用场景的理解,而非通用机器人技术 - a16z的通用科技投资团队暂时不会大规模布局机器人赛道,该赛道更适合懂垂直行业的美国动力(AD)团队投资
详细精要
特斯拉的人形机器人项目可能会带动整个行业的发展,吸引更多资本和人才进入,但短期来看通用性机器人落地还为时尚早
机器人投资的特殊性:机器人项目的核心壁垒是场景理解,而非通用技术,需要行业专属的投资能力。
💬 精华片段(中文)
我们非常相信机器人时代终会到来,但我们不觉得自己有能力做好这些项目的尽调,因为机器人公司往往是垂直的,你必须真正理解它们的下游市场。
"We're a huge believer that this is gonna happen. We just don't feel like we're in a good position to diligence these things. 'cause again, robotics companies tend to be vertical. You really have to understand the market they're being sold into."
本节重点 - 当单轮大模型训练成本达到10亿美元级别时,为该模型定制专用ASIC芯片已经具备经济合理性 - 定制ASIC相比通用GPU可以节省至少20%的训练和推理成本,10亿美元级训练跑次可以节省2亿美元,足够覆盖ASIC流片成本 - OpenAI已经在和博通等公司合作开发定制芯片,验证了该逻辑的可行性
详细精要
如果考虑ASIC可以带来的2-3倍效率提升,节省的成本会更高,经济价值更加明显
行业趋势验证:头部大模型公司已经开始布局定制芯片。
💬 精华片段(中文)
10亿美元级别的训练跑次,只要你能按时完成开发,做定制ASIC完全是合理的,现在问题主要是开发周期,而不是成本。
"A billion dollar training run of $1 billion training run. It makes sense to actually do a custom meic if you can do it in time. The question now is timelines. Yeah, but not money."
本节重点 - a16z的美国动力(AD)团队本质是面向硬科技、监管相关、政府采购类项目的市场细分团队,而非单纯的意识形态导向 - 湾区已经重新成为AI行业的绝对中心,之前Crypto、Web3带来的人才外流已经完全逆转 - a16z的投资布局优先聚焦湾区,其次是美国本土,再其次是美国盟友国家,核心是利用本地网络的积累优势
详细精要
AD团队的存在是市场细分的结果,而非单纯的意识形态导向,旨在提升硬科技项目的尽调和投后服务能力
AI行业的地理分布:湾区已经重新成为AI行业的绝对权力中心。
💬 精华片段(中文)
地理偏向有很强的复利效应,所有人都在同一个地方,你有成熟的生态、存在感和网络,投资效率会高很多。
"There's actually a lot of compounding effects for having a geographic bias. Right. You know, everybody's in the same place. You've got an ecosystem, you're there, you've got presence, you've got a network."
本节重点 - Claude Cowork已经成为成长期投资者的核心效率工具,可以自动完成数据分析、用户留存分析等之前需要手动完成的工作 - 投资者的核心工作仍然是网络资源对接,这部分暂时无法被AI替代 - Claude Cowork可以在几秒内完成之前需要熬夜几小时的 cohort留存分析,准确率完全达标
详细精要
该工具是Anthropic针对企业用户场景推出的核心产品,已经成为很多投资机构的标配工具
不可替代的投资者核心能力:网络资源对接、交易结构设计、创始人判断等核心工作暂时无法被AI替代。
💬 精华片段(中文)
有次半夜我们三个人在玩Claude Cowork,给了它一份原始数据, boom,输出的结果完全准确,我们核对了数字,太神奇了,这就是我的“啊哈”时刻。
"Our team, the other, it was like midnight and the three of us were playing with Claude Cowork. We gave it a raw file. Boom. Perfectly accurate. We checked the numbers. It was amazing. That was my like, aha moment."
本节重点 - AI行业未来存在两种完全相反的可能性,目前还无法判断最终走向 - 第一种可能是市场无限碎片化,出现大量全新的软件品类,大量公司都可以获得增长空间 - 第二种可能是少数通用模型寡头垄断整个市场,凭借资本和技术优势吞噬所有上层应用的份额
详细精要
这种情况下市场会非常碎片化,大量创业公司都可以获得生存空间,类似过去20年互联网行业的发展路径
未来二:寡头垄断:少数通用模型寡头凭借资本和技术优势,吞噬整个上层生态的价值。
这种情况下整个行业会形成3-5家通用模型寡头垄断的格局,几乎所有价值都会被底层模型公司获取,上层应用很难独立生存
当前的判断难点:行业格局还在快速变化,没有明确的收敛方向。
💬 精华片段(中文)
对我来说整个行业的未来就像那个站在岔路口的 meme,一条路是无限扩张的巨大市场,另一条路是通用模型寡头垄断一切,没人知道最终会走向哪一边。
"For me, like, like all the entire industry kind of like hinges on like two potential futures. So in, in one potential future, um, the market is infinitely large... And then there's another path which is like, well. Maybe these models actually generalize really well... you end up with basically an oligopoly for everything."
本节重点 - 即使通用模型没有实现完全的AGI能力,只要大模型公司能融到比上层应用生态总规模还多的钱,就可以吞噬所有上层市场 - 大模型公司可以通过API数据清晰看到上层应用的需求和规模,凭借资本优势快速跟进对应的功能 - 对于已经饱和的垂直领域,价值会向服务、实施等非模型环节转移,仍然有创业机会
详细精要
只要大模型公司的融资能力超过所有上层应用的总融资额,就可以投入足够的资源开发对应的功能,凭借更底层的模型优势和价格补贴抢夺市场,不需要具备完全的AGI能力
饱和领域的创业机会:对于模型能力已经饱和的垂直领域,仍然有大量创业机会。
💬 精华片段(中文)
如果你能融到比所有使用你模型的公司的总融资额还多的钱,那么你是不是AGI根本不重要,你会把他们全部吃掉。
"If you can raise more than the aggregate of anybody that uses your models, that doesn't even matter. It doesn't [00:33:00] even matter. See what I'm saying?"
本节重点 - 编码任务本质上是AGI完整的,不仅需要写代码的能力,还需要理解需求、沟通、知识检索等通用能力 - 不存在纯粹的“专用编码模型”,编码能力强的模型必然需要具备较强的通用推理能力 - OpenAI的模型分为两类:一类侧重推理能力,一类侧重交互体验,适配不同的使用场景
详细精要
之前大量创业公司推出的专用编码模型都没有成功,核心原因就是缺乏通用能力,无法满足实际编码场景的需求
模型能力的分化:大模型正在向两个方向分化,适配不同场景。
💬 精华片段(中文)
关于这个话题最被低估的一点是:到底有多少任务本质上是AGI完整的?我每天都写代码,非常清楚编码任务不仅仅是代码,它涉及一切。
"One more thing I think is, is underused in all of this is like, to what extent every task is a GI complete. Yeah. I code every day. It's so fun. And like. When I'm talking to these models, it's not just code. I mean, it's everything, right?"
本节重点 - Cursor是应用层公司向下渗透做模型的成功案例,仅用头部大模型1%的成本就开发出了顶级的编码模型 - Cursor的路径是先做应用积累用户和数据,再向下自研模型,既可以提升利润率,也可以避免被底层卡脖子 - 每个垂直领域都可能出现类似Cursor的公司,先占据应用场景,再向下布局自研模型
详细精要
这种路径的成本仅为头部大模型公司的1%左右,投入产出比非常高
对应用层公司的启示:所有头部应用层公司都应该考虑向下布局自研模型,提升利润率。
💬 精华片段(中文)
Cursor最有意思的地方是,他们只用了不到头部大模型1%的成本,就开发出了几乎是SOTA级别的模型,一度是全球最受欢迎的编码模型,这太疯狂了。
"The interesting about cursors, they actually for, you know, a small fraction of the cost, a hundred of the costs or less. Developed an almost soda model, which for a period of time was the most popular coding model in the world. Right? Which is really crazy to think about."
本节重点 - World Labs正在开发3D场景生成基础模型,可以将3D内容的边际成本降低3-5个数量级 - 语言模型天生不适合处理空间推理任务,需要专门的3D模型来实现空间智能 - 3D内容成本的大幅下降会颠覆游戏、影视、工业设计等多个行业,市场空间非常大
详细精要
3D场景的需求非常大,游戏、影视、工业设计、建筑、VR/AR等行业都需要大量3D内容,成本下降会释放巨大的市场需求
空间智能的特殊性:语言模型无法替代专门的3D模型实现空间推理。
生成式3D模型不需要用户环绕拍摄大量图片,仅用单张2D图片就可以生成完整的3D场景,包括看不到的背面部分,这是传统NeRF技术做不到的
Martin的个人参与:Martin正在参与开发开源3D渲染库Spark.js,弥补高斯泼溅技术的生态短板。
💬 精华片段(中文)
如果你能把有用的东西的边际成本降低3个数量级,历史上这种情况都会催生出非常大的公司。
"If you could do that for. You know, less than a dollar, that's four or five orders of magnitude cheaper. So you're bringing the marginal cost of something that's useful down by three orders of magnitude, which historically have created very large companies."
本节重点 - Thinking Machines虽然之前出现了创始人分裂的传闻,但a16z仍然非常看好,2026年将会有重大进展 - 当前社交媒体上的AI行业八卦与真实情况差距极大,很多传闻都是完全失真的 - 创始人应该埋头聚焦业务,不要被舆论噪音干扰,Cursor团队就是很好的正面案例
详细精要
团队已经解决了内部问题,正在推进核心技术研发,2026年将会有重大进展,a16z对其的信心比之前更强
舆论与现实的脱节:社交媒体上的AI行业传闻大多严重失真。
很多匿名账号发布的消息看起来非常确定,但实际上完全没有事实依据,已经到了非常荒谬的程度
对创始人的建议:聚焦业务,忽略噪音。
💬 精华片段(中文)
我可以保证,任何你在X上看到的八卦消息,和真实情况的差距都非常非常大,完全是被严重扭曲的。
"I guarantee you, for any of these gossipy things, I guarantee you it's way off. Way, way off. Like, like the general sentiment and like, and what happens is like we've got this crazy game of telephone right now where there's always. Seeds of truth, but it gets so warped by the time, like we hear all the time rumors about stuff that we're directly involved in."
本节重点 - AI行业的价值累积位置还远未确定,底层模型、应用层、中间层都有可能获得大量价值 - 应用层公司如果能占据场景和用户,向下布局模型,可以获得很高的利润率 - 大模型公司与上层应用的竞争将会长期存在,类似过去云厂商与SaaS公司的竞合关系
详细精要
如果走向寡头垄断格局,底层模型公司可能拿走70%以上的价值;如果走向碎片化格局,应用层公司可能拿走大部分价值
竞合关系的长期存在:大模型公司与上层应用的竞合关系会长期存在,类似过去云厂商和SaaS公司的关系。
💬 精华片段(中文)
我们在董事会有非常特殊的位置,我从来没见过公众认知和真实情况的差距像现在这么大,全行业都是如此。
"I will say this is the furthest, so we have a very privileged position on the boards of these companies, and like I'll say, I've never seen. The perception of the truth be further from the truth. Industry wide ever."
| 术语 | 解释 |
|---|---|
| ASIC(Application Specific Integrated Circuit) | 专用集成电路,本集中特指为大模型训练/推理定制的芯片,相比通用GPU可大幅提升效率降低成本 |
| AGI(Artificial General Intelligence) | 通用人工智能,指具备和人类同等的通用认知和解决问题能力的人工智能系统,是当前前沿大模型公司的核心目标之一 |
| Gaussian Splat(高斯泼溅) | 一种3D场景渲染技术,相比传统网格模型能更高效地生成高真实感的3D场景,是当前生成式3D领域的主流技术路径之一 |
| MFU(Model Flops Utilization) | 模型浮点运算利用率,衡量大模型训练/推理过程中芯片算力被有效利用的比例,行业平均水平约为50% |
| a16z AD Team(American Dynamism Team) | a16z旗下的美国动力投资团队,聚焦投资涉及监管、政府采购、硬件制造等领域的硬科技和产业项目 |
| NeRF(Neural Radiance Field) | 神经辐射场,一种通过2D图像重建3D场景的技术,需要多角度拍摄大量图像才能完成重建 |
| scaling laws(缩放定律) | 大模型领域的核心规律,指模型能力随训练数据量、参数量、算力投入的增加呈可预测的线性/对数增长,是当前AI融资逻辑的核心假设 |
| Dark GPUs | 闲置GPU,指已经采购但未被投入实际使用的GPU算力,本集中提到当前AI行业没有闲置GPU,所有算力都被充分利用,不存在供给过剩 |
| Acqui-hire | 人才收购,指收购公司的核心目的是获取创始团队和核心人才,而非产品或业务,本集中提到当前AI行业人才收购金额创下历史新高 |
| Cohort Retention | 群体留存,即用户分群留存分析,是成长期投资者衡量SaaS公司健康度的核心指标之一,本集中提到Claude Cowork可以自动完成该分析 |