18岁高中生唯一作者发顶刊,用AI发现150万个新天体
一个年仅18岁的高中生,独立操刀人生首个科研项目,就作为唯一作者在天文学领域的顶刊发表论文,并且凭此夺得重要科学奖项。这不是励志故事中的文学情节,而是现实世界中的真人真事。
撰文 | 小叶
18岁高中生Matteo Paz的科研生涯才刚刚开始,但他已经取得了令人羡艳的成就:自己的首个科研成果发表在天体物理领域颇具影响力《天文学杂志》(The Astronomical Journal)上。该刊创刊于1849年,是天文学领域历史最悠久、持续出版的专业期刊之一,长期以来积累了极高的学术声誉。
Matteo Paz作为唯一作者发表在《天文学杂志》上的论文 | 图源:《天文学杂志》
而且,凭借这一成果,Paz摘得了曾被美国前总统乔治·布什誉为“美国科学界超级碗”的再生元科学人才奖(Regeneron Science Talent Search,以下简称STS)桂冠,并荣获高达25万美元的奖金。
再生元科学人才奖颁奖典礼上的Matteo Pazo(左)| 图源:Society for Science
求知若渴的学生
Matteo Paz就读于美国加州帕萨德纳市的一所高中,世界最顶尖的百年理工类科学研究型高等学府——加州理工学院(以下简称“加州理工”)便坐落于该市,整座城市洋溢着浓厚的学术氛围。
从小学开始,Paz的母亲就定期带他去参加加州理工举办的免费天文科普讲座。这些讲座不限年龄、不限学术教育背景,尤其欢迎儿童参加,主题主要围绕天文学和空间科学。每次30分钟的科学家演讲结束之后,还有1小时的户外观星活动,抽象的天文知识立刻活灵活现地化作夜晚明亮的星空。如此熏陶之下,年幼的Paz深深迷恋上浩瀚星空,渴望着学习更多的天文学知识,好奇着更多星辰的故事。
好奇心永远是最强效的驱动力。2022年夏天,Paz毫不犹豫地加入加州理工的行星探索者学院(Planet Finder Academy)。这是该校与美国航空航天局(NASA)旗下著名的喷气推进实验室(Jet Propulsion Laboratory)联合组织的天文学项目,旨在为帕萨德纳学区的高中生提供动手实验、深入探索宇宙的机会。
天文学教授Andrew Howard的研究团队领导着该项目,老师们不仅教授天文学历史和基础知识,还教会了学生们其他各种必要的科研技能:Python编程、数据集分析、系外行星探测及识别等。此外,项目还积极培养学生的动手能力,例如,以伽利略的设计为灵感,让学生们动手制作望远镜,用来测量地球与天体之间的距离。
Howard从自己高中时代的科研经历出发,努力通过该项目不仅让学生们收获知识,更为有志于将来从事天文研究职业道路的学生打好基础。他的以身作则对学生们产生了深刻的影响,也就是这个夏天的行星探索者学院之旅,为Paz开启了独立创建自己科研项目的道路。
又过了一年,到了2023年夏天,Paz加入了加州理工的“暑期研究联系”(Summer Research Connection)项目。在此,学生们将接受实验室导师的直接辅导,展开为期6周的校内研究项目。也就在这年,Paz遇到了自己的科研启蒙导师:天文学家兼红外处理和分析中心(Infrared Processing and Analysis Center,简称IPAC)资深科学家Davy Kirkpatrick。
在过去的5个暑假中,Kirkpatrick不仅指导过本科生、科技爱好者和访问学者,还有着指导高中生的丰富经验。他如此满腔热情地投入这个项目,也和自己过去的个人经历息息相关。
Kirkpatrick在田纳西州的农业社区长大,上9年级时,他的化学兼物理老师Marilyn Morrison引导着他明确了自己的志向:成为天文学家。Morrison说服了Kirkpatrick的母亲,证明他有着成为优秀天文学家的潜力,并提供了详尽的信息,向他解释应该选修哪些课程,为将来能考入天文学专业做好充分准备。
“我效仿我的老师,希望将自己接受过的引导传递给更多人。”Kirkpatrick回忆说,“如果我看到了学生的潜力,就会不遗余力地鼓励他们充分发挥自己的才能,并尽我所能提供帮助。”
求知若渴的Paz遇上了求贤若渴的Kirkpatrick。在后者的指导下,Paz深入学习天文学知识和计算机科学。俩人在这年夏天建立起的师生关系,推动着Paz将自己对天文学的好奇与热爱,转化为真正意义上的科学研究实践。
独立操刀展开科研
多年来,Kirkpatrick一直在研究NASA于2009年发射的红外望远镜“广域红外巡天探测者”(Wide-field Infrared Survey Explorer,缩写为WISE)执行NEOWISE任务期间获得的观测数据。NEOWISE旨在搜寻近地天体,如小行星和彗星。但在十多年的探测期间,NEOWISE还收获了另一重要宇宙现象——变星的宝贵数据。
在天文学家眼中,变星难以捕捉,这类天体的亮度随时间发生周期性或非周期性变化,具体可分为脉动变星、爆发变星与几何变星三大类。
宇宙中存在的各种变星:脉动星[a]、类星体[b]、原恒星[c]、多恒星系统[d]、超新星[e]、磁活动恒星[f]等。出自Paz自制的研究简报 | 图源:Society for Science
目前,这些观测数据尚未得到充分利用,但其中恰恰蕴藏着宇宙中一些最令人困惑的现象。因此,对天文学家来说,这些数据如金矿般珍贵。如果他们能够通过数据准确识别出变星,那么就能更加深入地理解宇宙的演变过程,测量宇宙自大爆炸以来的膨胀速度,甚至有可能会改写物理学……
Paz一直渴望能够好好研究变星。“我很庆幸能遇到Davy。”他说道,“我记得第一次和他谈话的时候,说自己正在考虑写一篇论文来解决问题。这个目标绝不可能仅仅用6周就能完成。但是他并没有阻止我,反而鼓励说:‘好吧,我们来好好谈谈’。他给了我一段不受约束的学习经历。我想这是我能快速成为一名真正科学家的原因之一。”
在最开始构思研究的时候,Kirkpatrick和Paz的想法还非常简单:从天空中选取一小块区域,看看能不能从NEOWISE获得的观测数据中明确找出一些变星。然后,他们就能向学界重点介绍,告诉大家这些观测数据蕴含着多么巨大的发掘潜力。
当时作为初出茅庐的科研新人,Paz很快遇到了第一个棘手问题:据统计,十多年来NEOWISE探测的相关数据量达到了2000TB。在他之前,从来没有人尝试过使用如此庞大的数据来识别并分类系外天体。手动筛选明显不可取,而且Paz已经想出了另一个更妙的方法,他在高中的一门选修课学习经历提供了全新的解决问题视角:人工智能。
Paz非常清楚,像Kirkpatrick提供的这种海量有序数据集,通过人工智能训练可得到最佳筛选效果。而且他也有备而来,他在8年级的时候就完成了AP微积分BC课程。换言之,他已经掌握了编程所需的高等数学知识。
于是,Paz着手开发一套机器学习算法,用于分析整个数据集并标记出潜在的变星。在这6周内,他起草了人工智能模型,同时还经常咨询Kirkpatrick,“每次和Davy见面,我们10%的时间在工作,90%的时间在交流。” Paz回忆说,“有幸能和优秀导师一起聊科学,真的很爽。”
另一方面,Kirkpatrick还将Paz介绍给自己的同事。他们分享了自己的天文学机器学习,研究短期和长期变化天体方面的专业知识。Paz由此了解到,NEOWISE的观测存在一定特殊节奏,这意味着它无法系统探测和分类许多要么快速闪烁一次、要么在长时间内逐渐变化的天体,研究难度又上一级。
科学探索的意义和突破就在于迎难而上,但整个过程实际上漫长而又沉闷。Paz提到,虽然和各位专业学者的交流非常愉快,但更多的时候是他一人身处“幽暗的实验室,脸上挂着沉重的眼袋,死盯着电脑,绞尽脑汁要解决遭遇的一个又一个难题。”直到夏天结束,他的研究还在继续,仍有很多事情要去做。
一年之后的2024年暑假,Paz和Kirkpatrick继续合作。不过这次,Paz成为了指导其他高中生的“小导师”。同时,他继续改进着自己的人工智能模型,使其能够处理NEOWISE观测到的所有原始数据,并对结果进行分析。经过训练,他的算法能够检测NEOWISE测量结果中的细微差异,标记并分类出数据中150万个潜在的新变星。当时,师生俩计划在2025年发布NEOWISE数据中亮度差异较大的天体完整星表。
高中生成为专业论文的唯一作者
功夫不有心人,2024年11月,Paz在天体物理领域享有盛名的《天文学杂志》发表了经过同行评审的科研成果。
文章详细介绍了他基于波形的机器学习算法VARnet,依靠傅里叶变换和小波方法,从数十亿个数据点中提取变量候选点,这一方法对于处理海量天文学观测数据尤为有效。Paz使用结构清晰、完整的数据训练算法,最大限度地提高了算法的准确性。
Paz原创方法流程图 | 图源:10.3847/1538-3881/ad7fe6
具体来说,整个流程可归结为三个重要步骤:预处理和聚类分析、检测以及表征。
从预处理开始,为了分析全部近乎200TB的数据,Paz没有选择直接下载所有数据,因为光下载就需要50多天的时间。他将天空/数据划分成13000个等面积的区域,这样就可以同时并行处理可控的数据量。接下来是聚类分析,因为数据库中的每一行或每一条目都只对应着某一次天空中某一天体的观测记录,他需要将所有观测记录分组,以便获得每一天体随着时间而发生变化的数据组,这实际上相当耗费计算资源,用了超过1000小时的CPU时间。随后再通过几步操作将数据打包,就可以进一步分析了。
第二步就是变星检测,这里需要克服三大挑战:首先要确保能够明确区分出不良数据和真实变星,其次要确保自己的方法适用于宇宙任何区域,最后还要避免巨大的计算时间成本。基于此,Paz提出了VARnet信号处理和机器学习模型,能够很好地处理嘈杂的时间序列数据,随后可对天文时间序列数据进行随机分析。Paz使用生成的变化模拟现象训练了VARnet模型,结果每一个天体的源处理时间少于53微秒,加权准确率为98%。
最后是表征,不仅包括物理属性的描述,还包括计算参数,重点是对可变类型的分类。为此,Paz还使用了来自盖亚和2MASS等任务的外部数据,结合其他统计参数,为每一个天体创建一套配置数据,将其投喂给基于决策树的机器学习分类器,该分类器已使用NEOWISE中存在的大量数据进行过训练,以预测所观测到的变星。
总而言之,Paz总共调查了超过4.5亿个天体,生成了一套包含190多万个变星候选体的星表VarWISE,其中有150多万个属于全新发现。这套表格专注于囊括所有可能的变星,虽然这样做会牺牲一些纯度。接下来,Paz继续对数据进行了纯度筛选,最终生成了一个包含84万多个高置信度变星候选体的子表,其中有54万多个属于这次研究全新发现的天体。
“这是一个显然让你感到自豪的超大数字,尤其是你还能将数据可视化出来的时候。”Paz评价说。
以下便是他发现的所有候选变星的星图:
星表上所有190多万个天体的星空投影图 | 图源:Matteo Paz
“你看到了银河系,看到了卫星星系,仙女座星系,还看到了恒星形成区域。” Paz解释道,“尽管这只是非常单一的宇宙视角,只是在我们每一个发现的基础上对应绘制的一个个点,但仅仅如此,就能看出夜空这般复杂和壮丽。”
这篇论文详细透露了所有细节,唯独没有告诉读者,论文的唯一作者是一名年仅18岁的高中生。
如今,加州理工的一个红外光谱研究小组已经开始使用Paz的VarWISE来研究遥远宇宙中的双星系统。Kirkpatrick说,他们已经在表中发现了数十个之前从未探测到的恒星系统,Paz的研究成果正帮助他们计算遥远系外行星的质量。
用途还不仅限于此,“我的模型可以用于天文学中的其他时间域研究,甚至可能用于任何其他以时间格式呈现的研究,”Paz说。“我认为它与股票市场图表分析有一些关联,因为信息同样以时间序列的形式出现,并且周期性成分可能至关重要。你还可以研究大气效应,例如污染,其中季节周期和昼夜循环在其中发挥着巨大的作用。”
折桂再生元科学人才奖
好事成双,这一突破性研究还为Paz赢得了再生元科学人才奖(STS)的桂冠。
STS是美国历史悠久、且备受推崇的高中生科学、数学竞赛。在1942年创建以来,组织方一直致力于寻找、奖励并培养最有前途的年轻科研人才,同时也为原创研究提供重要的展示平台。为保证竞赛的专业性,一支由专业科学家组成的国家评审团对申请的每一项课题都展开最为严格的审查。
每年来自全美各地近2000名高中生“科研高手”报名参赛,展开独立的科学、数学或工程学研究,并接受权威科学评审的挑战。半个多世纪来,STS的获奖者中涌现了15名诺贝尔奖得主,3名科拉斯克奖得主,2名菲尔兹奖得主等等。
2024年,Paz带着自己的项目申请该竞赛,经过半年多的审核,从2500名参赛者中脱颖而出,不仅挺进了前十的决赛圈,还最终成为了第一名。在3月初的决赛周项目介绍视频中,他对于自己的项目侃侃而谈,讲述内容条理清晰,用平实的语言生动解释了所运用的复杂技术,不仅展示了对研究的方方面面了如指掌,其自信大方的表现也透露出其科研潜力。
当得知自己夺得冠军之后,他本人还是相当意外。因为进入决赛之后,Paz并不期待太高。不过,当他捧着奖杯害羞得满脸通红,但又笑得合不拢嘴时,还是暴露了他毕竟只有18岁,正是藏不住事的年纪。在接受《福布斯》采访的时候,他坦诚“自己还没完全适应成为冠军的事实。”
Matteo Paz在STS比赛过程中展示自己科研成果 | 图源:Society for Science
美国科学协会总裁兼首席执行官、《科学新闻》执行出版人Maya Ajmera评价道:“这些学生展现出了非凡的创造力和奉献科学的精神,凭借各自的聪明才智,一代年轻的科学家们寻求突破性的科学解决方案,有可能改变我们的世界,推进社会进步。”
除了Paz之外,Kirkpatrick也在Paz的整个参赛选拔过程中感受了指导学生大有所成的新经历:“当他们宣布Matteo获胜的时候,我也兴奋得不能自已。我以前也得过奖,但当你帮助他人发挥他们的潜力,最终获得专业认可的时候,那种感觉又是另一番滋味。”
Paz的未来之路……
虽然大部分时间Paz醉心于自己的天文研究,但并不表示他是个完全不问世事的“科技宅”。恰恰相反,他擅长身兼多职。他曾经创立并运营过一个名为“金钱至上——青少年金融教育”项目,他和项目成员走访中学,教授同龄人金融基础知识和理财知识。另外,Paz还拥有一家名为Elbows的音乐会推广公司,他与洛杉矶音乐节建立了深厚的联系,支持自己喜爱的音乐。
与加州理工的合作仍在继续,他目前在Kirkpatrick的IPAC部门兼职,这也是他人生第一份有偿工作。该部门负责管理、处理、归档和分析NEOWISE以及其他几个由NASA和美国国家科学基金会资助的太空任务数据。
对于自己的未来,Paz也有着明确规划,下一个计划就是上大学。他说自己已经被斯坦福大学录取了,目前还在考虑未来的职业发展方向。
最近他生活中的一场遭遇,让他有了新的科研方向。就在飞往华盛顿特区参加STS颁奖典礼几周前的一天夜里,Paz在家中醒来,发现窗外火光冲天,加州伊顿大火(Eaton Fire)如迅雷之势快速蔓延,当地人甚至都没来得及收到任何官方警告,大火就已烧至眼前。经过疏散和几天的火灾扑灭,他家的房子幸免于难。如今他正考虑将红外望远镜送入地球轨道的可能性,目的在于监测地球发生火灾的可能性。
不过,Paz仍然希望自己的发现能在天文领域继续开疆扩土,研究从大爆炸开始就难以捉摸的宇宙膨胀速度,并且帮助科学家揭开宇宙中的各种谜团。
Paz的科研故事还会继续,他所身处的浓厚学术环境,家人的支持,师长传承科学的不懈努力,都在引导着他坚定地攀登科研高峰。但更重要的是他个人的努力,他的科研信条很简单:一旦决定去做,就一定要敢于迈出第一步,接下来才会有第二步、第三步……越来越接近目标的实现。
感谢王善钦副教授阅读全文并提出修改建议。
参考资料
[1] https://iopscience.iop.org/article/10.3847/1538-3881/ad7fe6
[2] https://en.wikipedia.org/wiki/Regeneron_Science_Talent_Search
[3] https://www.astro.caltech.edu/outreach/stargazing-lecture-series
[4] https://www.caltech.edu/about/news/outreach-program-engages-public-high-school-students-in-the-discovery-of-exoplanets
[5] https://www.caltech.edu/about/news/high-school-students-research-at-caltech
[6] https://www.caltech.edu/about/news/exploring-space-with-ai
[7] https://doonwire.com/category/news/high-school-student-uses-ai-to-discover-1-5-million-new-space-objects-2025041404
[8] https://www.businessinsider.com/teen-wins-cash-award-ai-discovery-space-objects-nasa-2025-3?token=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJmaXJzdF9uYW1lIjoiWWUiLCJsYXN0X25hbWUiOiJKSU4iLCJtZW1iZXJfaWQiOiI0NzU2MTBjNy1iNDdkLTRiZDUtYWYwOC05YzE5NzA1MTFhZWQiLCJ
[9] https://www.youtube.com/watch?v=5KEyBcR5bww&t=32s
[10] https://www.societyforscience.org/society-alumni-honors/
[11] https://www.youtube.com/watch?v=5KEyBcR5bww&t=32s
[12] https://www.forbes.com/sites/kevinanderton/2025/04/08/teen-wins-250000-for-discovering-15-million-new-space-objects/
[13]https://www.smithsonianmag.com/smart-news/high-school-student-discovers-1-5-million-potential-new-astronomical-objects-by-developing-an-ai-algorithm-180986429/
[14] https://www.societyforscience.org/regeneron-sts/2025-student-finalists/matteo-paz/
[15] https://www.youtube.com/watch?v=8_AZ71yNUZY
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。