1982年电影《E.T.外星人》中的外星人。

机器学习擅长挑选出可能来自外星人的非常规信号资料来源:环球影业/Allstar/Alamy

从西弗吉尼亚州的丘陵到澳大利亚农村的平原,世界上最大的一些望远镜正在倾听来自遥远外星文明的信号。搜寻地外文明计划(SETI)是一项寻找人造电磁辐射信号的努力,这些信号可能来自遥远太阳系中技术先进的文明。今天发表的一项研究1描述了使用机器学习(人工智能的一个子集)来帮助天文学家快速筛选此类调查产生的大量数据的几项努力之一。作为人工智能重塑了许多科学领域那么,它对寻找地外生命有什么希望呢?

加州山景城SETI研究所的行星天文学家Franck Marchis说:“由于机器学习技术,这是SETI研究的一个新时代。”

对于SETI来说,大数据是一个相对较新的问题。几十年来,由于几乎没有任何数据,该领域受到了限制。天文学家弗兰克·德雷克在1960年开创了SETI,当时他在西弗吉尼亚州的格林班克将望远镜指向两颗恒星,并监听无线电传输。大多数SETI随后的搜索也仅限于少数恒星。

但在2015年,亿万富翁尤里·米尔纳在加州伯克利资助了有史以来最大的SETI项目:突破倾听项目在一百万颗恒星中寻找智慧生命的迹象.该项目利用西弗吉尼亚州、澳大利亚和南非的望远镜,寻找来自恒星方向、频率稳定变化的无线电发射,就像在相对于地球运动的行星上的外星发射器一样。

数据暴雪

问题是,这些搜索会产生大量数据,包括由来自手机、GPS和现代生活其他方面的地球干扰

SETI研究所的天文学家索菲亚·谢赫(Sofia Sheikh)说:“对我们来说,寻找SETI信号的最大挑战不是在这一点上获得数据。”“困难的部分是区分来自人类或地球技术的信号,以及我们从银河系其他地方的技术中寻找的信号。”

多云天空下的射电望远镜。

西弗吉尼亚州的罗伯特·c·伯德格林班克望远镜是帮助寻找外星文明的几个望远镜之一。来源:吉姆·韦斯特/阿拉米

手动进行数百万次观测是不现实的。一种常见的替代方法是使用算法来寻找与天文学家认为的外星信标相匹配的信号。但这些算法可能会忽略潜在的有趣信号,这些信号与天文学家的预期略有不同。

进入机器学习。机器学习算法是在大量数据上训练的,可以学习识别地球干扰的特征,使它们非常擅长过滤噪音。

被忽视的信号

加州大学伯克利分校的SETI科学家Dan Werthimer说,机器学习还擅长捕捉不属于传统类别的外星信号,这些信号可能被早期的方法遗漏了。

加拿大多伦多大学的数学家和物理学家、今天这篇论文的主要作者彼得·马(Peter Ma)对此表示赞同。他说:“我们不能总是预测外星人可能会向我们发送什么。”

马和他的同事通过“突破聆听”对820颗恒星的观测进行筛选,这些恒星是用100米的罗伯特·c·伯德绿岸望远镜观测到的。他们开发了机器学习软件来分析数据;它收集了近300万个感兴趣的信号,但大部分被丢弃为来自地球的干扰。然后,马云手动审查了超过2万个信号,并将其缩小到8个有趣的候选信号。

搜索最终一无所获——当团队再次收听时,所有8个信号都消失了。但这些方法也可以用于其他数据,比如南非由64台射电望远镜组成的MeerKAT阵列的大量观测数据,Breakthrough Listen于去年12月开始使用该阵列。马说,机器学习算法也可以用于存档的SETI数据,以寻找以前可能被忽视的信号。

公民SETI

机器学习也是下个月将启动的另一项SETI计划的核心。2月14日,加州大学洛杉矶分校(UCLA)的天文学家将发射一个community-science项目在这项计划中,来自公众的志愿者将对无线电信号图像进行分类,并将它们归类为潜在的干扰类型,以训练机器学习算法来搜索来自绿色银行的SETI数据。

人工智能可以在SETI过程的其他阶段提供帮助。Werthimer和他的同事们已经利用机器学习,为一个正在进行的SETI项目提供了一个观测恒星的排名,该项目使用的是世界上最大的单碟望远镜,即位于中国的500米FAST射电望远镜。

不过,加州大学洛杉矶分校的天文学家Jean-Luc Margot说,SETI可能会继续使用经典和机器学习的混合方法来整理数据。他说,经典算法在挑选候选信号方面仍然很出色,机器学习“不是万能的”。

“机器还不能做所有的事情,”Werthimer表示同意。