介绍
森林和植被一直是地球上人类生存的核心。它们提供我们呼吸的空气、我们吃的食物以及建造我们家园的材料。由于大量有趣的研究项目,有几个开源数据集说明了地球上森林和植被的分布。借助 Python 的魔力,我们可以获取这些数据集,分析它们,操作它们,并使用它们生成富有洞察力和引人注目的可视化效果,如上所示。
虽然可以说数据可视化是游戏的目标,但这是一项以数据操作和重新投影为核心的练习。我们将使用rasterio
并rioxarray
生成上面的可视化以及其他一些有趣的图表。
数据探索
有许多数据集,在本教程中,我们将使用来自日本地理空间信息管理局、千叶大学和合作组织的树木覆盖百分比 (PTC) 数据集(链接到数据集和许可证信息)。
该数据相当古老,显示的是 2003 年的森林,这显然是很久以前的事了,但是这里使用的方法将适用于其他森林数据集,或者实际上适用于存储在该数据集中的一些较新(但更大)的数据。存储库。事实上,该存储库中存在更高分辨率的数据集,但数据被分解为 12 个独立的 tif 文件,代表世界的 90x60 度块。可以组合不同的 tif 文件,但超出了本特定教程的范围,因此将在以后的文章中介绍。
数据存储在 tif 文件中,分辨率为 30 角秒(约 1 平方公里)。在 tif 文件的每个网格点中,都有一个 0-100 之间的值,对应于 1 平方公里区域内的树木覆盖百分比。水体的值为 254,没有给出数据 255。