AI 工程
LLM 训练与推理的幕后数学:一堂黑板讲座
批处理(Batch Size)是速度与成本的关键:通过简单的吞吐率和内存带宽方程,可以精确量化批处理大小如何影响单 token 的延迟和成本,揭示了高吞吐与低成本之间的根本权衡。
Substack (Dwarkesh Podcast) | Reiner Pope | Apr 29, 2026Apr 29, 2026
NVIDIA
《Dwarkesh播客:独家对话黄仁勋》
核心护城河:覆盖全产业链的生态、CUDA可编程性与供应链协同能力,难以被复制。
Substack | 黄仁勋(Jensen Huang) | 2026-04Apr 15, 2026
访谈
Dwarkesh播客:Michael Nielsen谈科学进步的识别、超长验证闭环与科技树的偶然性
科学进步速度远超验证闭环速度:人类科学往往在实验验证完成前就已广泛采纳更优理论,不存在统一的标准化判断流程。
Substack | 嘉宾 Michael Nielsen | 日期 Apr 07, 2026Apr 07, 2026
NVIDIA
Lex Fridman播客第494期:黄仁勋(Jensen Huang)独家深度访谈
极端协同设计是NVIDIA当前核心战略:打破芯片级设计局限,从硬件、软件到数据中心全栈优化,实现远超线性的算力增长。
Lex Fridman Podcast | 黄仁勋(Jensen Huang,NVIDIA创始人兼CEO) | 2026年3月23日Mar 23, 2026
访谈
Dwarkesh Podcast:陶哲轩谈AI时代的科学发现与数学研究
开普勒研究类比大模型范式:AI可批量试错挖掘经验规律,但验证与价值判断仍是核心瓶颈。
Substack | 嘉宾:陶哲轩(Terence Tao) | 主持人:Dwarkesh PatelMar 20, 2026
Anthropic
Felix 谈 Anthropic Claude Cowork 诞生、本地优先代理与知识工作的未来
Claude Cowork 起源:基于 Claude Code 意外的非编码用途爆发,仅用 10天 整合内部组件完成开发,面向非终端用户开放代理能力
Latent Space Podcast | Felix Rieseberg | 2026-03Mar 17, 2026
AI 研究
AI Agent 对工作带来的冲击——以学术研究为例
AI Agent已覆盖学术研究全执行环节:可独立完成论文撰写、模型训练、审稿、数据分析等工作,效率远超人类
YouTube | 台大AI领域课程讲师 | 2026-03-15Mar 15, 2026
AI 研究
《无界好奇心:MIT宋寒教授解读高效AI的技术路径与应用价值》
核心价值:高效AI通过压缩技术降低大模型算力、能耗成本,同时提升运行速度,是产业刚需
YouTube | 主持人:Sally Kornbluth(MIT校长)、嘉宾:宋寒(Song Han,MIT EECS副教授) | 2026-03-11Mar 11, 2026
NVIDIA
NVIDIA AI工程师:行星级代理推理与「光速」工作法——Nader Khalil(Brev)、Kyle Kranen(Dynamo)
双产品全栈覆盖:Brev降低GPU获取门槛,Dynamo实现数据中心级推理优化,覆盖从个人开发者到企业级的全场景需求
Latent Space(Substack) | 嘉宾Nader Khalil(NVIDIA Brev开发者关系负责人)、Kyle Kranen(NVIDIA Dynamo工程负责人/核心架构师) | 2026-03-10Mar 10, 2026
AI 研究
持续自我改进的AI——斯坦福大学Zitong Yang博士答辩
持续自改进AI定义:明确参数化、预训练两大前提,划定自改进AI三类核心属性,锚定研究边界。
YouTube | Zitong Yang(斯坦福大学博士) | 2026-03-03Mar 03, 2026
Anthropic
传统设计流程已死:替代方案是什么?| Claude设计负责人Jenny Wen访谈
传统设计流程淘汰:AI驱动工程效率暴涨,设计师需放弃线性流程,转向支持执行+短期方向指引的双模式工作
YouTube | Jenny Wen(Claude Co-work设计负责人) | 无录制日期Mar 01, 2026
AI 资讯
《SemiAnalysis创始人Dylan Patel解读2000亿美元AI资本支出、芯片战争,以及为何2027年谷歌可能无利润》——In-Context Cooking首期节目
2000亿AI资本支出趋势:揭秘谷歌1800亿美元、亚马逊2000亿美元2026年AI基建投入逻辑,预判2027年头部云厂商或零利润
Substack | Dylan Patel | 2026年2月28日Feb 28, 2026
AI 产品
Builders Unscripted 第一期:OpenClaw创造者Peter Steinberger访谈
OpenClaw爆火背景:个人开发者靠AI工具短时间打造爆火开源AI代理,登华尔街日报,形成全球社区
YouTube | Peter Steinberger | 2026-02-24Feb 24, 2026
创投
丹·桑德海姆的Anthropic、OpenAI与SpaceX投资内幕
公私市场差异:拆解2026年晚期私域市场机会与公私域竞争逻辑的核心区别
YouTube | Dan Sundheim(D1 Capital Partners创始人兼CIO) | 2026年2月录制Feb 24, 2026
AI 产品
Lex Fridman播客#491:Peter Steinberger与OpenClaw智能体革命
OpenClaw爆发逻辑:开源智能体项目短时间收获18万+GitHub星标,核心是将现有AI能力组合为可直接交互、自主执行任务的实用工具
Lex Fridman Podcast | 嘉宾 Peter Steinberger | 科技访谈Feb 22, 2026
创投
风险投资vs成长期投资的惨痛教训:Anthropic vs OpenAI、Noam Shazeer、World Labs、Thinking Machines、Cursor、ASIC经济——与a16z的Martin Casado和Sarah Wang对谈
AI融资新模式:风险投资与成长期投资边界完全模糊,大额融资本质是算力合约,融资可直接快速转化为模型能力。
Latent Space(Substack平台) | 嘉宾:Martin Casado(a16z基础设施合伙人)、Sarah Wang(a16z成长期合伙人) | 日期:2026-02-19Feb 19, 2026
Anthropic
Claude Code负责人Boris Cherny:当编码被彻底解决后,行业会发生什么
编码已基本被AI解决:未来1-2年手动编码技能将不再必要,Anthropic内部工程师人均生产力提升超200%
YouTube | Boris Cherny | 2026-02-24Feb 19, 2026
Anthropic
Light Cone访谈:Claude Code创作者Boris Churnney分享下一代AI开发工具的构建逻辑
面向未来的开发逻辑:不为当前模型做产品,面向6个月后的模型能力布局,避免被迭代淘汰
YouTube | Boris Churnney(Claude Code创始工程师) | 2026-02-17Feb 17, 2026
Anthropic
Dario Amodei:数据中心里的天才国度——从 AGI 时间线到全球治理
"大计算团假设"十年不变:Dario 在 2017 年提出的核心假设至今成立——规模、数据、目标函数才是决定因素,所有"需要新方法"的聪明都不那么重要;RL 扩展与预训练扩展遵循同样的规律
Dwarkesh Podcast | Dario Amodei(Anthropic CEO)| 2026Feb 13, 2026
Google DeepMind
Jeff Dean:从 Google 搜索到 Gemini,亲历 AI 基础设施三十年
蒸馏是 Flash 模型的引擎:用最大模型的 logits 作为软标签,使小模型超越上一代大模型,Gemini Flash 由此实现"低价≈顶配"
Latent Space | Jeff Dean(Google Chief AI Scientist)| 2025Feb 13, 2026
科学
🔬超越AlphaFold:Boltz如何开源药物发现的未来
结构预测的“已解”假象:单链蛋白预测依赖进化共变信号取得突破,但缺乏演化信息的复杂互作和多构象动态仍是未解难题
Latent Space播客 | Gabriele Corso & Jeremy Wohlwend | Feb 12, 2026Feb 12, 2026
AI 产品
OpenClaw开发者:为什么80%的应用将会消失
OpenClaw爆火:开源本地AI代理一夜获16万GitHub星标,生态快速扩张
Youtube | Peter Steinberger | Feb 07, 2026Feb 07, 2026
Anthropic
我们都对Claude Code上瘾了
Claude Code核心优势:通过子代理拆分上下文,CLI形态适配性强,编码效率提升5倍
YouTube | Kelvin French Owen | 2026年2月6日Feb 06, 2026
AI 产品
《OpenClaw运行原理:“魔法”背后的架构》
OpenClaw无自主感知:本质是事件驱动的响应系统,所有行为均为预设输入触发,无思考推理能力
YouTube | 专注AI应用开发的技术博主 | 2026年2月3日Feb 03, 2026
AI 资讯
《大模型领域花哨概念拆解:揭开智能体、Agent等术语的真实逻辑与包装套路》
概念拆解:逐一解释LLM、Prompt等10+大模型术语底层逻辑,破除行业包装噱头
YouTube | 匿名科技博主 | 2026-02-03Feb 03, 2026
AI 产品
OpenClaw创始人如何用AI每天仅花40分钟打理生活 | 彼得·斯坦伯格
个人AI代理趋势:未来通用个人AI将替代80%的手机独立应用,自然对话成为主流交互方式
YouTube | **Peter Steinberger** | 2026-02-01Feb 01, 2026
AI 资讯
2026年AI现状:大语言模型、编码、缩放定律、中国、智能体、GPU、通用人工智能
中美AI竞争格局:中美在AI研发和产品层面竞争加速,中国开源大模型发展迅猛,美国闭源大模型在用户体验和商业化上暂时领先,短期无绝对赢家。
Lex Fridman Podcast | 嘉宾:Nathan Lambert、Sebastian Raschka | 日期:无Jan 31, 2026
AI 工程
Claude Code 是如何工作的——Jared Zoneraich,PromptLayer
简单 while 循环就是全部架构:Claude Code 的核心只有四行逻辑——有 Tool Call 就执行、把结果还给模型、循环直到没有 Tool Call 为止,所有顶级编程 Agent 都在用这套
YouTube | Jared Zoneraich(PromptLayer 创始人)| NYC AI Engineering Workshop 压轴场Dec 26, 2025
Anthropic
我们为何开发并捐赠了模型上下文协议(MCP)
MCP开源捐赠:Anthropic将MCP捐赠给Linux基金会,彻底消除厂商闭源风险
YouTube | David(MCP联合创造者、Anthropic技术成员) | 2025年12月11日Dec 11, 2025
OpenAI
智能体强化微调——OpenAI Will Hang与Cathy Zhou技术分享
Agent RFT:OpenAI推出的工具类智能体专用微调技术,样本效率极高最低仅需10个样本
Youtube | Will Hang、Cathy Zhou | 2025-12-09Dec 09, 2025
AI 资讯
GPU、TPU与AI经济学深度解析 | Gavin Baker访谈
AI芯片竞争格局:英伟达Blackwell、谷歌TPU等路线直接决定AI厂商成本与竞争位势
Youtube | Gavin Baker | 2025年12月9日Dec 09, 2025
Anthropic
别构建Agent,转而建设技能——Anthropic Barry Zhang与Mahesh Murag分享
核心范式转变:Anthropic提出放弃定制各领域Agent,转向通用Agent+可组合技能的新架构,大幅降低落地成本
Youtube | Barry Zhang、Mahesh Murag | 2025-12-08Dec 08, 2025
Google DeepMind
斯坦福AI俱乐部对话Jeff Dean:AI领域的重要趋势
AI发展底层逻辑:15年AI突破是算法、算力、软硬件协同优化的共同结果
YouTube | Jeff Dean | 2025-11-24Nov 24, 2025
Anthropic
《Claude Code背后的开发工程师揭秘其核心秘密》
终端原生架构:放弃传统IDE侧边AI模式,直接打通终端全权限,实现工程师与模型双向对等操作
YouTube | Cat & Boris(Claude Code核心开发负责人) | 2025-10-29Oct 29, 2025
AI 研究
斯坦福AI俱乐部访谈:Jason Wei谈2025年AI领域的3个核心理念
智能商品化:AI能力一旦突破就会快速降价,公共信息获取成本趋近于零,核心价值转向私有信息
YouTube | Jason Wei | 2025年10月17日Oct 17, 2025
Anthropic
深度揭秘Claude Code团队的超快迭代方法论 | 嘉宾Cat Wu
自下而上迭代机制:爆款功能多起源于工程师自研原型,经内部灰度验证后快速上线,反馈差的功能直接废弃
Youtube | Cat Wu(Claude Code产品负责人) | 2025年9月14日Sep 14, 2025
AI 工程
陈天奇20年机器学习生涯:从竞赛少年到AI系统开源领袖
底层能力积累:高中自学编程、ACM班训练、早期科研失败经历为后续开源项目成功奠定核心基础
Youtube | 陈天奇 | 2025年9月12日Sep 12, 2025
AI 工程
对话Tri Dao:Flash Attention作者谈AI芯片竞争、推理优化与下一代架构
英伟达生态竞争:未来2-3年AI芯片市场将从英伟达一家独大转向多厂商差异化竞争
YouTube | Tri Dao | 2025年9月10日Sep 10, 2025
Anthropic
Claude Code:你终端里的Anthropic智能体
产品定位:Claude Code是运行在终端的Unix风格编程智能体,主打原生模型访问、高可组合性、按token付费的灵活模式
Latent Space播客 | Cat Wu(Claude Code产品经理)、Boris Cherny(Claude Code首席工程师) | 2025年5月7日May 07, 2025
Anthropic
我们如何构建高效智能体:Anthropic 巴里·张分享
场景筛选优先:智能体仅适配高复杂度、高价值、错误易校验的场景,无需为所有用例开发
YouTube | **Barry Zhang** | 2025年4月4日Apr 04, 2025
AI 研究
LLM Agents MOOC | UC伯克利CS294-196 2024秋季学期:LLM智能体的历史与概述
[LLM智能体定义]:明确文本智能体、LLM智能体、推理智能体三层概念的差异与演进逻辑
YouTube | Shunyu Yao(姚顺雨) | Sep 17, 2024Sep 17, 2024
OpenAI
斯坦福CS25 第四季:OpenAI研究员Jason Wei与Hyung Won Chung分享大模型核心逻辑与AI发展规律
大模型底层逻辑:下一词预测本质是超大规模多任务学习,覆盖语法、世界知识、推理等千万级细分任务
YouTube | Jason Wei、Hyung Won Chung | 公开讲座May 06, 2024
AI 工程
第四讲:计算与内存基础
GPU计算架构逻辑:讲解流多处理器、线程束、线程块的调度规则,明确提升GPU占用率的核心方法
Youtube | Tom Vman | 2024-02-05Feb 05, 2024
科学
GLP-1、肽类与万亿美元的健康革命
GLP-1药物是数十年一遇的突破:它不仅用于减重,更能从根本上预防糖尿病、心血管病、肾病、成瘾,市场年营收将超 1000亿美元。
YouTube | Alex Carnault | 未标明未标明
AI 工程
AI推理的未来——UCSD张灏分享
2025年推理核心进展:预填充-解码拆分架构全面落地,单GPU吞吐量较连续批处理提升1倍
Dynamo Day活动 | 张灏(Hao Zhang,UCSD教授) | 未标注未标注
NVIDIA
深入拆解NVIDIA Dynamo端到端架构设计
全链路推理系统:NVIDIA Dynamo是端到端大模型推理服务系统,兼顾灵活性、可扩展性与容错性
NVIDIA | Eli(Dynamo首席架构师) | 日期未提供未提供
AI 产品
为什么一半的产品经理正身处险境 | Nikhyl Singhal (Meta, Google)
产品管理正经历根本性重塑:从“信息搬运”转向“构建与判断”,传统 PM 技能加速贬值
YouTube | Nikhyl Singhal |未知
没有找到匹配的纪要 🔍