我仅出于数据分析的角度进行阐述,如有学术严谨性问题可随时提出,我并不能保证此文章中学术相关的完全正确性。
地外行星,在离太阳系遥远的光年之外,隐匿在无人的黑暗深空中。但在 2006 年起,天文领域发明了行星的凌日观测法之后,每年所发现的地外行星如雨后春笋般的出现,尤其是在 2009 年开普勒太空望远镜升空之后。那么 NASA 是如何从数量众多的行星数据中确定宜居行星的呢?现在,跟我来一起看看如何使用 Tableau 把那些宜居行星找出来。
我们先按照太阳系现有的行星,确定下相对于地球大小(赤道半径)的比值:
星球相对于地球的赤道半径比}
火星0.532
地球1
海王星3.883
木星11.209
分类结束后,我们需要到 NASA 公开的系外行星数据库中下载数据:
https://exoplanetarchive.ipac.caltech.edu/docs/data.html

下载 Kepler KOI Table
图表,接着我们要对图表数据进行清洗,保留我们需要的字段:
英文字段名称说明
kepid开普勒编号
kepler_name开普勒命名
koi_disposition确认状态
koi_pdisposition开普勒数据确认
koi_score评分
koi_period行星公转周期
koi_prad行星大小
koi_teq行星平均温度
koi_insol行星日射强度
除上述字段外的其它字段全部删除,然后改变下字段的翻译,最终:

然后我们打开 Tableau,首先选择数据源,导入 Excel 文件。导入之后要对数据做初步的筛选,在确认状态这一栏中,CONFIRMED
表示已经确认,FALSE POSITIVE
为假阳性,CANDIDATE
为可候选。这里我们只对已确认的行星做分析,所以筛选条件选择确认状态,值为 CONFIRMED
:

筛选添加之后,我们回到工作表中。在这里我们要了解何为宜居,我们先以简单的大条件作为判断依据,行星的平均温度在 0℃ 或以下时,液态水不存在,会结冰;行星的平均温度在 70℃ 以上时,液态水会加速蒸发。所以我们将平均温度在 0~70℃ 内定位宜居温度,也就是 273~343K。其次,行星的大小也影响引力,我们以地球为例,在地球的 0.82 倍之间的大小是人类可接受范围。
好的,那么两个维度我们已经可以确定了:行星大小以及平均温度。
我们把平均温度拖拽到列上,把行星大小拖拽到行上,并将这两者修改为维度,你会看到这样的图:

数据出现了,但是可视化效果很差,我们来做一些优化吧!右击平均温度轴,将比例调整为对数,且为对称。右击行星大小轴,将比例调整为对数,且为对称。点击左侧标记区域的大小,拖至最小。此时你会得到这样一个图:

很好,一个散点图已经出来了,现在我们继续。在图表区域中添加行星大小的分隔线,点击左侧分析选项卡,在自定义中找到参考线,拖拽到表-行星大小上,并输入对应的分隔值,比如火星大小是 0.53,再把标签改为自定义显示的文字。重复操作其它的分隔线,我们能得到下面这样的图:

此刻已经离成果不远了。我们再来把类地行星的大小区间加上去,仍然在分析选项卡中,自定义内的参考区间拖拽到表-行星大小上,区间开始填 0.8,区间结束填 2,因为我们通常认为 0.82 倍大小的地球在人类的可接受范围中。同样的,可自定义标签内容为类地行星,我们再用淡绿色填充区间。

接下来,我们要找出平均温度在 273343K 之间的行星。同样选择参考区间,拖拽至表-平均温度,区间开始填写 273,区间结束填写 343。我们最后用一个淡蓝色填充区间。

你发现了吗,绿色和蓝色交错的区域,就是我们要找的类地宜居行星了。
我们还可以把图表美化一下:

在茫茫的宇宙中,目前人类已经确认的行星中,也只有这么二十多颗和地球大小差不多的宜居行星,再次感叹人类是多么渺小啊!