使用神经网络识别系外行星

2019 年 11 月 26 日

由加州大学圣克鲁兹分校天文学和天体物理学博士生安妮·达蒂洛撰写。

介绍

什么是系外行星？我们如何找到它们？最重要的是，为什么我们要找到它们？系外行星是指太阳系以外的行星 - 它们围绕除太阳以外的任何恒星运行。我们可以通过几种方法找到这些系外行星：径向速度法、凌星法、直接成像法和微引力透镜法。最常用的方法，也是我用来寻找行星的方法，是凌星法。

寻找系外行星

“凌星法” 并非最早用于探测系外行星的方法，但它是最有效的方法，已经发现了 4,000 多颗行星¹。当我们绘制一颗恒星随时间的亮度变化时，我们称之为光变曲线。如果一颗行星从我们的角度经过这颗恒星前方，我们看到的光就会变暗，光变曲线上会出现一个凹陷 - 凌星事件。如果这种情况周期性地发生，那就表明这颗恒星周围可能存在一颗行星。

行星凌星的演示。当一颗行星经过其宿主恒星前方时。我们接收到的来自恒星的光会以特定的形状变暗。

许多望远镜专门用于使用这种方法寻找行星，包括地面望远镜和太空望远镜。其中包括 WASP²、NASA 的开普勒太空望远镜，其第二个任务称为 K2³，以及其继任者 TESS⁴。这些望远镜持续地指向天空的某些部分，以便同时观测数千颗恒星。它们观测的时间越长，可能找到的行星就越多！

由于这些望远镜观测了如此多的恒星，数据中也可能存在误报信号，例如食双星、其他天体物理现象或仪器噪声。我专门使用 K2 数据训练我的神经网络，由于望远镜变得不稳定，我的数据中存在大量额外的噪声，这些噪声成为了令人信服的行星候选者。

开普勒在其第二个任务中并没有观测几颗恒星；它观测了数千颗。对于一名人类天文学家来说，仔细查看一小部分数据并始终如一地找到行星候选者已经很困难了，但要仔细查看 200,000 个信号，并始终如一地、及时地、无偏见地识别行星与误报信号，则极其困难。这需要一种自动化的、无偏见的方法来识别行星候选者。

神经网络

我的同事克里斯·沙卢和安德鲁·范德伯格已经证明，可以使用 CNN 在原始的开普勒数据⁵中发现多行星系统。之前的模型也是用 TensorFlow 建立的，对于从未做过任何机器学习的人来说，它很容易学习，并可以从头开始构建。

我使用 CNN 在 K2 数据中寻找行星。我的 CNN 基于沙卢和范德伯格的工作，并进行了修改以适应我更加嘈杂的数据。我使用了 K2 1-16 号观测周期，排除了 9 号和 11 号观测周期，因为它们主要关注微引力透镜目标。这些观测周期的提取光变曲线可以在这里找到。然后，按照范德伯格 2016⁶中描述的方法，在这些光变曲线中搜索周期性事件。此过程产生了 51,711 个信号，其中 31,575 个信号被人工分类为三类，以便为神经网络创建训练集。

当数据具有类似的形状和大小时，CNN 的效果最佳，但相位折叠的光变曲线可以根据行星系统的特征呈现多种形状和大小。行星的轨道周期各不相同，其凌星深度也不相同。

我将数据处理成两个图像特征：局部视图和全局视图。“全局视图”是指整个相位折叠的光变曲线，凌星事件位于中心，并进行 bin 处理，以便每个全局视图都具有相同的长度。“局部视图”是指凌星事件的放大视图，仅包含事件两侧的两个持续时间，而不是整个周期（也进行 bin 处理，以便每个局部视图都具有相同的长度）。这些特征被标准化，以便凌星深度始终为 -1。现在，我们对可能的行星有了两个具有相同形状和大小的视图！

来自 Dattilo 等人 2019 年 7 月论文的图，展示了全局视图和局部视图之间的差异

我使用 27,634 个被标记为三类之一的信号训练了 CNN。

“E” 表示食双星
“J” 表示垃圾/仪器伪像
“C” 表示行星候选者

最终训练集中信号数量的减少是由于上述预处理阶段中的某些“失败”。我们使用 80% 的信号训练了 CNN，保留 10% 用于验证，保留 10% 用于我们的最终测试集。我们使用 Adam 优化器⁸进行了训练，并运行了 4,000 次迭代。

最终 CNN 的架构

结论

训练完成后，我们有一个测试集，我们可以从中了解模型根据对每个信号的预测学习了哪些关于行星的信息。此模型可用于新数据集，以寻找新的行星。我的模型在训练后取得了成功，在测试集上的准确率达到了 98%。非常成功，以至于我能够用它识别并验证了两颗新的系外行星！

在介绍中，我问了为什么要寻找系外行星，有很多原因。我们大约 30 年前才发现太阳系以外的行星，因此该领域非常年轻。我们需要增加行星样本量，以了解行星的形成方式、行星的普遍性以及行星种群的差异。为了找到像地球这样的行星，我们需要提高发现方法的灵敏度，而使用像这种方法这样的技术可以有所帮助。

如果您想了解更多信息，可以在这里找到我的方法的完整说明，我的代码可以在这里找到。请注意，此代码是用旧版本的 TensorFlow 编写的，如果您今天学习它，应该从 2.0 版开始。您可以在这里找到教程。如果您想开始在行星数据上测试自己的神经网络，可以在这里找到克里斯·沙卢的完整指南。此模型代码是用旧版本的 TensorFlow 编写的，但 2.0 版最近发布，比以前更易于使用。要开始使用各种深度学习，请查看 TensorFlow 教程，就像我所做的那样！

安妮·达蒂洛目前是加州大学圣克鲁兹分校天文学和天体物理学博士生，研究系外行星的人口统计学。这项工作是在德克萨斯大学奥斯汀分校与安德鲁·范德伯格博士和克里斯·沙卢合作完成的，得到了约翰·W·考克斯基金会的资助。

注释

"NASA 系外行星档案。" https://exoplanetarchive.ipac.caltech.edu/。 2019 年 9 月 9 日访问。 ↩
"WASP 行星 | 来自广角 .... 的凌星系外行星。" https://wasp-planets.net/。 ↩
"开普勒和 K2 任务 | NASA。" 2018 年 10 月 30 日，https://www.nasa.gov/mission_pages/kepler/main/index.html。 ↩
"主页 - TESS - 凌星系外行星巡天卫星。" https://tess.mit.edu/。 ↩
"使用深度学习识别系外行星：五颗行星 ...." 2017 年 12 月 13 日，https://arxiv.org/abs/1712.05044。 2019 年 10 月 2 日访问。> ↩
"来自开普勒太空望远镜第一年观测的行星候选者 ...." http://iopscience.iop.org/article/10.3847/0067-0049/222/1/14/meta。 2019 年 11 月 1 日访问。 ↩
"使用深度学习识别系外行星 II：两颗新的超级 ...." 2019 年 3 月 25 日，http://arxiv.org/abs/1903.10507。 ↩
"Adam：一种随机优化方法。" https://arxiv.org/abs/1412.6980。 ↩

下一篇文章

Identifying Exoplanets with Neural Networks

社区 ·

使用神经网络识别系外行星

2019 年 11 月 26 日 — 由加州大学圣克鲁兹分校天文学和天体物理学博士生安妮·达蒂洛撰写。
介绍什么是系外行星？我们如何找到它们？最重要的是，为什么我们要找到它们？系外行星是指太阳系以外的行星 - 它们围绕除太阳以外的任何恒星运行。我们可以通过几种方法找到这些系外行星：径向速度法、凌星法、直接成像法…