来源: Neil Ashton Podcast | Prof. Max Welling | Jul 09, 2024 分类: 其他 原文发表: Jul 09, 2024 纪要生成: 2026-06-25
Max Welling 教授是机器学习领域的顶尖专家之一,现为阿姆斯特丹大学教授,曾师从“AI 教父” Geoffrey Hinton。他不仅在学术界地位超然,担任过 NeurIPS 等顶级会议主席,还曾出任 高通(Qualcomm) 和 微软(Microsoft) 的副总裁及杰出科学家。近期,他离开微软创立了专注于利用机器学习进行碳捕获材料发现的新公司 CuspAI。本期节目围绕 AI 用于科学(AI4Science) 这一宏大主题,深入探讨了物理学与数据驱动的博弈、基础模型的未来、开源伦理以及学术与产业界的职业路径选择。
本节重点
详细精要
双向影响:不仅 AI 推动科学进步,科学和数学中的原理(如对称性、类似热力学的扩散过程)也被用来构建更好的机器学习模型。
科学计算工具的共性:尽管科学学科在尺度上跨度巨大,但底层的数学工具惊人地相似。
物理交互通常是局部的(Local),即远处的事件不会瞬间影响当前位置。
图像/视频生成模型与科学模拟的深度关联:看似不相关的领域之间存在工具的直接复用。
💬 精华片段(中文)
"The interesting thing is that there‘s also signs for A I in a way which is the, you know, using principles from the sciences and the mathematics such as [...] symmetries, diffusion processes like thermodynamics to build better machine learning models." “有趣的是,也存在着‘科学用于 AI’的情况,也就是利用科学和数学的原理,比如对称性、类似热力学的扩散过程,来构建更好的机器学习模型。”
本节重点
详细精要
过约束风险:科学家使用的物理方程往往是宏观上的粗粒化(Coarse-grained)近似。若将此近似作为硬性约束,而模型凭海量数据本可以学到比该近似更精确的规律时,物理约束就成了人为强加的“性能天花板”。
小数据场景:物理定律作为归纳偏置:当数据匮乏时,必须引入物理结构使学习变得可行。
💬 精华片段(中文)
"If you have so much data that the model can actually learn something that‘s more precise than [...] those constraints you’re giving it, then you‘re constraining the model over constraining the model and that’s, that’s hurtful." “如果你拥有如此多的数据,使得模型实际上能学到比你给它设定的约束更精确的东西,那么你就是在过度约束模型,这是有害的。”
本节重点
详细精要
验证:目前已有充分证据表明,这种“预训练 + 微调”的范式在科学领域行之有效,且在可预见的未来会继续有效。
科学领域的“八二法则”:能达到 80% 的准确率往往只需 20% 的努力,但最后的 20% 极其艰难。
大语言模型类比:ChatGPT 等聊天机器人完成了 80% 的惊艳表现,但现阶段的攻坚点在于防止模型被诱导说出“在披萨里放胶水”或“吃石头”等荒谬言论,这涉及到常识推理、社会交互理解和伦理规则。
科学预测的致命尾部风险:在物理世界应用中,最后 20% 的错误可能是灾难性的。
💬 精华片段(中文)
"You can get it right 80% and that hopefully is useful. But then how do you protect yourself against that 20%? You know, an unseen initial condition with incredibly important consequences like [...] a heat wave, 50 °C. Do we warn the public or do we not because we don’t know precisely what's going on?" “你可以把 80% 的事情做对,这希望是有用的。但是你该如何防范那剩下的 20% 呢?比如一个未见的、但后果极其严重的初始条件——比如 50 摄氏度的热浪。我们是向公众发出警告,还是因为我们并不确切知道会发生什么而保持沉默?”
本节重点
详细精要
大多数公司和大学将数据视为昂贵资产,囤积在防火墙之后(如飞机设计、工业流体数据),导致科学发展缓慢。
构想:基于隐私保护的 AI 数据市场:
数据定价与确权:用户应有权决定数据用途。帮助非营利医院可免费,但如 Google 等巨头使用则应收费。这能解决当前艺术创作者被无授权抓取音视频用于训练 生成式 AI 并被诉诸法院的普遍矛盾。
激励相容优于道德呼吁:
💬 精华片段(中文)
"We have to realize that data is perhaps the most important [...] resource. It’s kind of the the new oil on which these machines [...] and compute, I guess, right? So it’s computing and data that these machine learning methods need and we just need to put a real value on it." “我们必须认识到,数据可能是最重要的资源。它就像是驱动这些机器的新石油,我想算力也是如此。机器学习和人工智能方法需要算力和数据,我们需要给它赋予真实的价值。”
本节重点
详细精要
伦理委员会:Max 认为未来可能需要设立专门的伦理委员会,对某些过于强大技术的开源进行安全评估与审批。
商业导向的开源逻辑:
社区防御策略:小公司无法单独与大公司对抗,但如果一群小公司联合起来,共建一个基础模型并开源共享,各家企业就能基于此模型与大公司竞争,这是一个明显的激励联盟。
基于危机的协作动因:
本节重点
详细精要
影响力特征:通过发表论文让他人借鉴实现影响力,过程间接且分散。学术研究风格独特,但也面临身兼数职(写申请、教书、管理、做科研)和获得终身教职前缺乏保障的职业压力。
大工业(Big Companies)的角色:
结构性内耗:大公司是“缓慢的政治野兽”。任何微小改动都需要漫长的法律审查和层层审批,流动性极低,如同高粘滞性的流体。
初创公司(Startups)的角色:
💬 精华片段(中文)
"To my surprise, perhaps is that the amount of resources you can get in a start up these days in the field of A I is no less than what you would get in a big tech company." “令我惊讶的是,当今在 AI 领域,你在一个初创公司能获得的资源规模,一点也不比在一家大型科技公司里所能获得的少。”
本节重点
详细精要
人才红利:欧洲的 AI 顶尖人才库极其庞大,且许多人喜欢欧洲的生活环境。欧洲的工程师薪资远低于硅谷湾区。这意味着用更少的投资就能在欧洲搭建起一支世界级团队,这一巨大价值吸引了越来越多的国际投资人。
硅谷生态系统的运作机理:
本节重点
详细精要
工作原理:当空气吹入 MOF,材料会选择性地优先结合二氧化碳分子,而非氮气或水蒸气。随后通过改变温度或压力(例如减压和加热)将捕获的纯净二氧化碳释放并隔离或再利用。
全流程 AI 加速管道:
搜索策略:由一个中心化搜索智能体(Search Agent) 统筹调度,以最快速度在万亿级空间中找到拥有理想 CO2 吸附特性的材料。
商业与市场逻辑:
本节重点
详细精要
现今的年轻人面临着更艰难的抉择,因为工业界提供的起薪可能是学术界的 10 倍。
是否读博士/做博后的取舍:
非单一线性路径:职业道路已不再是单向单程。可以先创业再回学术界,也可以先在大厂任职。关键是在工业界也要坚持适时发表高质量论文,保持重返学术界的通道畅通。
学术界与工业界的弹性结合:
本节重点
详细精要
数据壁垒:AI4Science 难以立刻复制 ChatGPT 的巨大成功,根本原因在于其他科学领域缺乏互联网级别的公开数据沉淀。
气候倒逼技术突破的必然性:
资金与人才的洪流:随着灾难事件的清晰化,将会有巨额资金和大量人才涌入聚变(Fusion)、碳捕获、清洁能源等赛道,利用量子计算与AI创造出前所未见的神奇新材料。
社会使命感与人才流动: