“最大的障碍来自物理学界”,MIT物理学家反思AI与物理的结合
在一次采访中,美国国家科学基金会(NSF)人工智能和基本相互作用研究所(IAIFI)主任杰西·塞勒(Jesse Thaler)畅谈了AI和物理学富有成效的交叉。他分享了自己从机器学习怀疑者转变为倡导者的思想转变经历,并分析了AI与物理学双向互动可能带来新发现的潜在路径。
撰文 | FirstPrinciple
翻译 | 1/137
杰西·塞勒(Jesse Thaler) 图源:Jared Charney
杰西·塞勒(Jesse Thaler)是麻省理工学院(MIT)理论粒子物理学家[1],他寻求通过将量子场论和机器学习(machine learning)的技术相结合,来解决基础物理学中悬而未决的重要问题。他还是美国国家科学基金会(NSF)人工智能和基本相互作用研究所IAIFI(Institute for Artificial Intelligence and Fundamental Interactions)[2]的主任。
IAIFI于2020年成立,获得了NSF为期五年的资助,旨在将波士顿地区探索人工智能(AI)问题、物理学问题及其交叉领域的人才聚集在一起。
最近,FirstPrinciples(以下简称FP)就人工智能与基础物理学交叉领域的挑战与机遇,以及IAIFI研究人员正在进行的工作等问题采访了塞勒(以下简称JT)。他分享说,就在不久前,他的学生还不得不说服他“从机器学习的‘老学究’变成机器学习的‘布道者’”。他甚至开玩笑说,这次采访的后续问题可以直接向ChatJesseT[3]提出(见下图),这是他的学生和博士后专为愚人节而创作的ChatGPT搞笑版。
为清晰起见,采访内容经过删节和编辑。
FP: 你能谈谈IAIFI的成立以及你是如何参与其中的吗?
JT:我是一名理论物理学家。我曾在苏黎世参加一个活动,当时一群从事理论粒子物理的朋友刚开始使用机器学习。我开玩笑说:“深度学习?我们是理论物理学家,应该做深度思考!”这个玩笑最终成了IAIFI的标语:深度学习+深度思考=更深入的理解(Deep learning + Deep thinking = Deeper understanding)。人工智能和物理学其实是一条双向道:一方面是AI对我们研究新物理现象的影响,另一方面是将物理学的思维方式应用于AI系统的运行。
那是2016年7月,我刚开了这个玩笑,同年9月,两位出色的研究生就带着他们硕士期间写的一篇论文来到我的办公室,试图说服我。我所做的那种第一性原理研究与高等计算、统计推理(Statistical reasoning)、计算机科学和AI等方法之间确实存在协同效应。
我明确地告诉他们,我认为物理学研究不应该朝着这个方向发展,即只是做机器学习的现成应用。而他们实际上也同意我的观点。他们的博士研究真正关注的是将物理原理注入AI,并教会机器像物理学家一样思考。
从某种意义上说,IAIFI是为帕特里克·科密斯克(Patrick Komiske)和埃里克·梅托迪夫(Eric Metodiev)这些学生建立的,因为我意识到在AI和物理学之间的交叉领域上,当时并没有真正的职业发展机会。它曾是(并将继续是)一个新兴领域。如果有人想深入研究物理学的主题,但也想研究计算和统计学,那么他们在学术生态系统中该如何定位呢?这就是向NSF申请资助以创办该研究所的动机。
美国国家科学基金会人工智能和基本相互作用研究所于2020年启动 图源:IAIFI
FP:你认为这个交叉领域有哪些令人激动的机会?
JT: 如果只将AI应用于基础物理学研究,那么这一领域面临着巨大的挑战,我们正在努力理解自然界中一些最深层次的问题。
也许并非人尽皆知的是,在2012年发现希格斯玻色子的背后有大量的机器学习算法在发挥作用。大型强子对撞机(Large Hadron Collider,LHC)会产生海量数据。为了筛选这些数据,机器学习现在是数据分析的一个非常标准的部分。如今,机器学习正逐渐从浅层学习转向深度学习。我们甚至开始看到生成式(Generative)AI在影响我们对物理分析的思考方式。
宇宙学是另一个拥有海量数据的领域,并且运行宇宙的模拟需要巨大计算成本。如果没有机器学习这样的技术,我们根本无法处理这些问题。
中微子实验提供了又一个例子。美国正在大力投资一种名为“液氩时间投影室”(Liquid Argon Time Projection Chambers, LArTPC)的探测器技术。这有点像是回到了气泡室(bubble chamber)时代[4],那时人们会查看粒子相互作用的单个图像——只不过现在这些图像(数据)随着束流(beam)的每一次“倾泻”而快速、密集地出现。你不可能人工逐一查看这些图像,但你需要类似人类的推理能力来弄清楚发生了什么。在这种情况下,如果没有机器学习帮助我们筛选这些信息,这项技术甚至无法运行——这正是AI在基础物理研究中显得绝对必要的一个例子。
2024 年度诺贝尔物理学奖获得者约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton)图源:Ill. Niklas Elmehed © Nobel Prize Outreach
至于物理学如何应用于AI,这一点可能并不那么显而易见。为什么物理学能够帮助我们理解AI系统呢?当然,随着最近诺贝尔奖的揭晓[5],这种联系或许更容易解释了。我们至少看到了四种物理学对AI产生影响的方式。
第一种是将物理学融入现有的AI系统。例如,如果你想让一个机器人在某个环境中导航,你会希望教它一些关于物理系统、三维空间以及旋转对称性等方面的知识。甚至一些利用AI实现的强大计算机图形效果,也依赖于光线追踪(ray tracing)技术,它基于描述光如何传播的物理学原理。
第二种是物理学为AI提供支持,源自物理学的概念可以帮助你构建更好的AI工具,即便并不是直接研究物理系统。你可以设计出嵌入了物理学思维方式的机器学习架构,而这些概念被证明是非常强大的。
然后,还有AI的物理学(physics of AI),即把AI当作一个真正的物理系统来思考。例如,相变(phase transitions)是物理学家非常熟悉的一个概念。AI并非只是一种单一的存在。由于你可以通过调整机器学习算法中的超参数(hyperparameter)来改变其行为,因此AI可以表现出不同的“相”(phase)。随着对这些超参数的调整,AI会经历不同的“相”,学习方式也会随之改变。IAIFI的研究人员正在探索这方面,他们考虑使用物理学分析工具来理解AI。
最后,物理学正在推动AI实现一些连AI专家都未曾想过其算法能够做到的事情。宇宙学是一个多尺度(multi-scale)问题,其动力学发生于宇宙作为一个整体的层面,还要逐步聚焦,直到个体星系的层面。如何处理这些不同尺度上的现象?这确实是将 AI 算法推向了极限,因为很多AI都是为文本处理或图像识别而设计的,这种多尺度的性质并不那么明显。
FP:与物理学的某些子领域相比,IAIFI 科学家所从事的领域正在以惊人的速度发生变化。这种快速变化,带来了哪些独特的挑战或机遇?
JT: 嗯,这绝对需要我们以不同的方式思考问题。作为一名理论物理学家,我的主要工具箱是量子场论。你可能会问,“量子场论怎么可能从AI中受益?”量子场论基于严格的计算,而关于AI的固有印象往往是,“哦,AI会产生幻觉。”在需要严格计算的情景中怎么使用AI呢?
你必须创造性地思考如何做到这一点。我的一位IAIFI同事正在研究简化理论表述。众所周知,计算量子散射振幅(quantum scattering amplitude)的传统方法需要成堆的草稿纸,但如果简化它们,(这些计算)可以压缩到一行。实际上,弄清楚这种压缩是非常具有挑战性的,因为你面对的是具有非常复杂性质的特殊函数。
有了大型语言模型,我们已经知道如何总结文本。利用这种文本总结的方法来进行方程的总结也并非难事。因为你知道其中的规则,你可以让AI输出它用于简化方程的规则,然后验证这些规则是否真正有效。机器学习为我们提供了一种启发式的方法,使我们能够在有限的计算时间内得到合理的答案。
盲人摸象 图源:wiki
在我的研究中,我一直在尝试整合不同类型的理论计算。这有点像盲人摸象的故事,只不过这里的“象”是一个大家争相追逐的基础物理计算。你可能无法直接计算它,但可以在特定极限情况下做一些计算——你可以计算大象鼻子,也可以计算大象尾巴,然后找到一种方法将它们合而为一。
我能否将这种整合过程转化为一个优化问题(optimization problem)?如果可以,而且能够用这种语言重新表达我的问题,那么机器学习就提供了一种解决方案。而我的责任在于弄清楚这个解决方案意味着什么。这要求我得像机器一样思考。如果我能做到这一点,那么我就能完成一些仅靠纸笔计算无法完成的事情。
FP:创造力并不是通常与AI联系在一起的东西。
JT:是的。我们通常认为创造力是人类大脑的一种特殊能力。但我认为,从ChatGPT那里我们学到,通过穷举搜索(exhaustive search)也可以获得一种创造力。我其实真的不太明白它是如何工作的。但也许,我们需要思考过去的发现,哪怕只是作为一个思想实验,包括像爱因斯坦的广义相对论这样基础性的理论。我们是否可以通过对理论可能性空间(space of theoretical possibilities)的穷举搜索来发现它?对这个问题,是否存在一种解决方案,而不需要这种灵光乍现的洞察力飞跃?
我觉得还没有人真正成功做到这一点。但已经有迹象表明,数值和文本数据之间的联系可能比人们想象的要紧密得多。可以想象我们进行这样的对话,在未来——尚不清楚是1年后还是10年后——人们通过用AI的语言来表述问题,从而提出新的概念性突破。那将是非常令人兴奋的。
FP:你提到了ChatGPT,生成式AI已成为公众意识中普遍存在的话题。这种兴趣的激增使IAIFI研究人员的工作更轻松,还是更困难?
JT: 因为我们所做的工作与研究本身更根本的好奇心有关,所以我们没有(至少直接地)面临一些关于AI的社会担忧,尽管我们非常清楚我们为基础物理学应用开发的技术可能会进入社会应用领域。
伦理学中也存在算法的一面,即通过计算工具来做出决策。我的一位从事实验研究的同事曾尝试设计一种算法,使其能够做到无偏(unbiased)收集LHC数据。当然,这种去偏(de-biasing)的方法也适用于更广泛的社会应用。他实际上将他的工具应用于一些基准医学影像和监禁数据集(incarcerationdata sets)[6],并发现其性能优于其他方法。
我认为最难向人们解释的是,这些算法本质上是概率性的(probabilistic)。每次在ChatGPT中输入一个提示词(prompt),你都会得到不同的答案。作为一名物理学家,这对我来说是非常常见的。我的意思是,量子力学就是这样的。统计推理是我们所做工作的核心,至少在现代物理学中是这样。
很多时候,最大的障碍来自我们物理学界。许多物理学家并不接受AI,部分原因是他们不了解它能做什么,或者只将其与深度视频伪造(deepfake video)联系在一起。现成的AI并不适合物理学的应用。但通过适当的调整,你可以拥有与传统方法一样稳健的AI系统。
至于要说服他们,最好的方法和当初说服我的方式一样。需要一个年轻人走进你的办公室,展示AI能做什么——它能满足我们习惯的科学严谨性的标准,并且它还能回答你从未想过能用传统方法解决的问题。我们真的需要通过一次又一次的交流来说服那些持怀疑态度的同事。
我不认为人工智能会消失。作为科学家,我们不能像鸵鸟一样把头埋在沙子里。我们需要开始理解这些系统的工作原理,特别是为科学界设计AI系统。现成的AI并不完全适用于科学发现,但它已经很接近了。我们可以通过与计算机科学界的协作,推动两个领域的发现。
FP:你能谈谈IAIFI与政府和产业界的联系吗,为什么这些联系很重要?
JT:IAIFI的研究人员主要研究的是好奇心驱动的问题。但是,好奇心驱动的科学和应用项目驱动的科学之间存在着一个连续体,从黑板上开始的想法最终可以进入消费者手中。
目前,AI相关的讨论主要由消费级应用或行业应用推动,但与其他领域的专家交谈可以获益良多——不仅仅是物理学,还有哲学、历史、宇宙学、化学、生物学以及地球和行星科学等等。它们中每一个领域都有自己的数据框架和相应的理解,如果它们参与到对话中,则可以获得有益的见解。
我去了国会山并与工作人员进行了交流。每个人都需要对AI有所了解,但也需要明白AI在不同领域有着不同的表现形式。至少,我们所有人都必须从教育的角度去思考它。我有一个12岁的儿子,所以我非常清楚他可能会启动一个聊天机器人来完成他的作业。拥有不同领域的视角是非常重要的。我们正在努力让物理学界的声音被听到,而不仅仅是那些大型公司的声音。
FP: IAIFI最初的五年投资大约已经进行了四年。你认为该研究所到目前为止取得了哪些成就?你对它的未来有何设想?
2024 IAIFI 暑期学校的学员 图源:IAIFI
我真的很自豪我们已经将“AI+物理”确立为人们认可的领域。我们的IAIFI博士后奖学金取得了巨大的成功。实际上,我们的第一轮研究员,也有我们第二轮的部分研究员将继续在工业界和学术界工作。他们正在从事的工作是以前并不真正存在的。有两个具有物理学背景的研究员被计算机科学系聘用的例子,看到这样的发展真的很令人兴奋。我希望物理系最终也能雇用具有更多计算机科学背景的人。它需要是一条双向的道路。
具体而言,我们正在努力争取让IAIFI获得NSF的续期资助。更广泛地说,我们的愿景是将我们已经开展的“AI+物理学”的工作扩展到“AI+科学”,强调科学发现的方式将会改变,每个领域都有能力为这一变革做出贡献。
至于到底会是什么样子呢?我们将拭目以待,看看是持续的政府支持,还是来自基金会支持或私人慈善捐赠。但我的希望是,五年后,你会看到在这个跨学科领域中出现更多的职位(以及更多的突破)。
译者注
[1]参见Jesse Thaler在MIT的主页:https://physics.mit.edu/faculty/jesse-thaler/。
[2]参见:https://iaifi.org/。
[3]可访问:https://chatjesset.com/。
[4]气泡室是1952年美国物理学家格拉泽(Donald Arthur Glaser, 1926-2013)发明的。它曾给高能物理实验带来许多重大的发现。格拉泽因此获得了1960年诺贝尔物理学奖。
[5]本文首发于2024年11月。
[6]监禁数据集(incarceration data sets)指人口统计、犯罪信息、监狱系统等相关数据。这里表示他们利用数据集来测试和验证算法的公平性,以确保算法在处理敏感社会数据时不会产生偏见。
本文经授权译自FirstPrinciples, In conversation: Jesse Thaler on AI and physics
原文地址:https://www.firstprinciples.org/article/in-conversation-jesse-thaler
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。