https://blog.tensorflowcn.cn/2020/09/fast-supernovae-detection-using-neural-networks.html
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiUN4BwxyDO_z9aF1X7THghaKM2-Jpjup6W7fNz1_0C6RzTK-r5sKJ-o8bFsAQRxScfIOypgXtAKf-a-JduWMnuVQFvLqs2K23e6Im79wrwVmK_rGtr2Ngz3XYmlMGMlTGsOZ7bAbK1omU/s1600/crabnebula.png
Rodrigo Carrasco-Davis 和
ALeRCE 合作组、
千禧年天体物理研究所,智利
引言
天文学是对天体(如恒星、星系或黑洞)的研究。研究天体就像拥有一个自然的物理实验室——在那里发生着自然界最极端的现象——而且其中大多数现象无法在地球上复制。观测宇宙中的极端事件使我们能够通过将我们已知的物理学知识与我们在宇宙中观察到的现象进行比较,来检验和改进我们的理解。
有一种特定类型的事件对天文学家来说非常有趣,它发生在巨大恒星生命的尽头。恒星是由氢原子聚集而成,并被重力拉在一起,当密度足够高时,氢原子开始融合,产生光并产生氦、碳、氧、氖等元素。聚变过程产生向外的压力,而重力产生向内的压力,在恒星燃烧其燃料时保持恒星稳定。当恒星试图融合铁原子时,这种状况发生了变化,这不仅不会产生能量,反而会从恒星中提取能量,导致恒星核心坍塌,并发生超新星爆炸。
|
蟹状星云,超新星残骸。空间望远镜科学研究所/NASA/ESA/J. Hester/A. Loll(亚利桑那州立大学)。此图来自 hubblesite.org。 |
这个过程对天文学家来说非常重要。由于爆炸期间的极端条件,天文学家可以观察到重元素的合成,测试物质在强压强和高温下的行为,以及观察爆炸的产物,它可能是中子星或黑洞。
超新星也可以用作标准烛光。天文学中的一个典型问题是测量到天体的距离。由于恒星距离地球非常遥远,很难知道一颗恒星是暗淡且靠近我们,还是遥远且非常明亮。宇宙中大多数超新星爆炸发生的模式相似;因此,天文学家使用超新星来测量距离,这对于宇宙学家来说很重要,例如,研究宇宙膨胀和暗能量。
尽管超新星爆炸非常明亮(与它们自身宿主星系的亮度相比),但由于它们距离地球非常遥远,以及它们的发生率很低(大约每个星系每个世纪发生一次超新星),以及爆炸的短暂性(可能持续几天到几周),这些事件很难找到。此外,为了从超新星中获取有用的信息,有必要进行后续观测,即用一种叫做光谱仪的仪器观测超新星,以测量爆炸过程中在多个频率上发射的能量。早期后续观测是必要的,因为许多有趣的物理过程发生在爆炸开始后的几个小时内。那么我们如何在宇宙中所有其他观测到的天体中快速找到这些超新星爆炸呢?
现代天文学
几十年前,天文学家必须选择并指向天空中的某个特定天体来研究它们。现在,现代望远镜,例如
兹威基瞬变设施(ZTF),它目前正在运行,或者
维拉·C·鲁宾天文台,将以非常高的速度拍摄天空的图像,每三天观测一次可见天空,从而创建南半球天空的影片。如今,ZTF 望远镜每晚生成 1.4TB 的数据,实时识别并发送有关天空中的有趣变化天体的信息。
当某个物体改变其亮度时,这些望远镜能够检测到这些变化并生成警报。这些警报通过数据流发送,其中每个警报都包含三个 63x63 像素的裁剪图像。这三个图像称为科学图像、参考图像和差分图像。科学图像是该特定位置的最新观测结果,模板通常在调查开始时拍摄,并用于与科学图像进行比较。科学图像和模板之间发生的所有变化都应该出现在差分图像中,差分图像是在对参考图像进行一些图像处理后将其减去科学图像而计算得到的。ZTF 望远镜目前每晚流出高达一百万个警报,平均为十万个。假设一个人想手动检查每个警报,那么如果检查每个警报需要 3 秒,那么在正常情况下,**查看一个晚上所有警报大约需要 3.5 天**。
组织所有传入警报流是一项艰巨的任务。当一个新的警报到达时,生成警报的天体类型并不一定已知。因此,我们需要检查我们是否已经从其他观测结果(交叉匹配)中了解到这个物体。我们还需要弄清楚哪种天体产生了警报(分类),最后,我们需要组织数据并将其提供给社区。这是天体经纪系统(如
ALeRCE、
Lasair、
Antares)的职责。
由于这些警报基本上是天空中发生的所有变化,因此我们应该能够在 ZTF 望远镜发送的所有警报中找到超新星。问题是,其他天体也会产生警报,例如亮度发生变化的恒星(变星)、活动星系核 (AGN)、小行星以及测量错误(虚假警报)。幸运的是,科学图像、参考图像和差分图像中有一些可区分的特征,可以帮助我们识别哪些警报是超新星,或其他物体。我们希望能够有效地区分这五类物体。
|
五类天体,可以使用仅第一个警报进行区分。以下是每类五个示例,分别显示科学图像、参考图像和差分图像。 |
总之,活动星系核往往出现在星系的中心。超新星通常发生在宿主星系附近。小行星在太阳系平面附近被观测到,并且它们不会出现在模板图像中。变星在充满其他恒星的图像中被发现,因为它们主要存在于银河系内。虚假警报有不同的原因,其中一些是相机中的坏像素、生成差分图像的错误减法、宇宙射线(图像中中心警报中非常明亮、集中且尖锐的区域)等。正如我之前提到的,人类不可能手动检查每个警报,因此我们需要一种自动方式对其进行分类,以便天文学家可以检查最有可能成为超新星的最有趣的来源,以便进行后续观测。
使用神经网络寻找超新星
由于我们大致了解了五类物体之间图像的差异,原则上我们可以计算特定特征以对其进行正确分类。但是,手工制作特征通常非常困难,并且需要很长时间的反复试验。这就是我们决定训练一个卷积神经网络 (CNN) 来解决分类问题的原因(
Carrasco-Davis 等人,2020 年)。在这项工作中,我们仅使用第一个警报来快速找到超新星。
我们的架构通过对训练集中每个图像创建 90 度旋转的副本,并在对图像每个旋转版本的密集表示应用平均池化后提供旋转不变性。在这项问题中强加旋转不变性非常有用,因为图像中的结构可能没有特定的方向 (
Cabrera-Vives 等人,2017 年、
E. Reyes 等人,2018 年)。我们还添加了警报中包含的部分元数据,如天空坐标中的位置、到其他已知物体的距离以及大气条件指标。在使用交叉熵训练模型后,概率高度集中在 0 或 1 的值附近,即使分类器在其预测的类别中出错时也是如此。当专家在模型做出预测后进一步过滤超新星候选对象时,这并不方便。0 或 1 的饱和值不会提供任何关于错误分类以及模型做出的第二或第三类猜测的可能性方面的见解。
因此,除了损失函数中的交叉熵项之外,我们还添加了一个额外的项来最大限度地提高预测的熵,以将输出概率的值分散 (
Pereyra 等人,2017 年)。这提高了预测的粒度或定义,在整个 0 到 1 的范围内获得概率,而不是集中,产生更具可解释性的预测,以帮助天文学家选择好的超新星候选对象以供后续观测。
|
具有增强旋转不变性的卷积神经网络。为每个输入创建旋转副本并馈送到相同的 CNN 架构,然后在连接到元数据之前在密集层中应用平均池化。最后,应用两个其他全连接层和一个 softmax 来获得预测。 |
我们对空间上均匀分布在 ZTF 覆盖范围内的 400,000 个物体进行了推理,作为模型预测的健全性检查。事实证明,CNN 预测的每个类别在空间上的分布都符合每个天体的性质。例如,AGN 和超新星 (SNe) 主要在银河系平面之外被发现(河外天体),因为由于遮挡,不太可能在银河系平面中看到更远的物体。该模型正确地预测了靠近银河系平面 (银河纬度更接近 0) 的物体数量更少。变星在银河系平面内被发现的密度更高,这被正确地预测出来。小行星在太阳系平面附近被发现,也称为黄道 (用黄色线标记),正如预期的那样,虚假警报分布在各个地方。在一个大型未标记集中进行推理给了我们关于训练集偏差的非常重要的线索,并帮助我们识别 CNN 使用的重要元数据。
我们发现图像(科学、参考和差异)中的信息足以在训练集中获得良好的分类,但集成元数据信息对于获得预测的正确空间分布至关重要。
|
未标记的天体对象的空间分布。每个图都在银河坐标系中。银河纬度以银河系为中心,因此离 0 较近的纬度也离银河系平面较近。银河经度表示我们从银河系平面内看到的圆盘的哪个部分。黄线代表太阳系平面(黄道)。 |
超新星猎手
该项目的重要组成部分是 Web 界面,它允许天文学家探索由我们的神经网络模型排序的候选者,这些候选者被认为是超新星的可能性。该
超新星猎手是一个可视化工具,显示有关警报的重要信息,以便天文学家选择应报告为超新星的物体。它还有一个按钮可以报告我们模型做出的错误分类,以便我们可以将其添加到训练集中,以便以后使用这些手工标记的示例来改进模型。
|
超新星猎手:超新星候选者探索的用户界面。它显示一个列表,其中包含具有较高超新星概率的警报。对于每个警报,警报的图像、物体的定位和元数据都显示在网页上。 |
使用神经网络分类器和超新星猎手,我们已经能够光谱学地确认 394 个超新星,并将 3060 个超新星候选者报告给
瞬变名称服务器,从 2019 年 6 月 26 日到 2020 年 7 月 21 日,每天报告 9.2 个超新星候选者。超新星发现率的急剧增加导致爆炸早期阶段可用的超新星数量大幅增加。
未来
我们目前正在努力提高模型的分类性能,以获得更好的超新星候选者,并减少专家助手来报告它们。理想情况下,我们希望拥有一个足够好的系统,可以自动以高置信度报告每个可能的超新星候选者。
我们还想扩展我们的模型,以便它可以
使用多个戳记。我们开发了一个神经网络模型,它能够接收一系列图像而不是单个戳记,因此每次针对特定对象有新图像可用时,模型都能够整合新到达的信息,从而提高其对每个类的预测置信度。
我们努力的另一个关键点是专注于使用异常值检测技术寻找稀有物体。这是一项至关重要的任务,因为这些新的望远镜可能会由于前所未有的采样率和每次观测的空间深度而揭示出新型天体。
我们认为这种分析海量天文数据的新方法不仅有帮助,而且是必要的。数据的组织、分类和重新分配对于科学界来说是进行天文数据科学的重要组成部分。这项任务需要来自不同领域(如计算机科学、天文学、工程和数学)的专业知识。薇拉·C·鲁宾天文台等新型现代望远镜的建设将极大地改变天文学家研究天体的方式,作为 ALeRCE 经纪人,我们将做好准备,使其成为可能。如需了解更多信息,请访问
我们的网站,或查看我们的论文:
ALeRCE 论文,它描述了完整的处理流程,
戳记分类器(本文中描述的工作)以及
光变曲线分类器,它通过使用称为光变曲线的时间序列提供了更复杂的分类,其中包含更大的分类法。