空气质量预测

news/2024/11/30 11:30:51/

文章目录

    • MSSTN: Multi-Scale Spatial Temporal Network for Air Pollution Prediction
      • 问题提出
      • 网络结构
        • S-Net
        • T-Net
        • F-Net
        • 源码
      • 数据集分析
    • GeoMAN: Multi-level Attention Networks for Geo-sensory Time Series Prediction
      • 问题提出
      • 网络结构
        • 空间注意力
        • 编码器
        • 时间注意力
        • 外部因素融合
        • 解码器
    • Group-Aware Graph Neural Network for Nationwide City Air Quality Forecasting
      • 核心思想
      • 模型结构
        • 自注意力网络
        • 可微分分组网络
        • 建模城市群之间的依赖关系
        • 建模城市之间的依赖关系
        • 解码器
        • K-means对比
        • 数据集分析

MSSTN: Multi-Scale Spatial Temporal Network for Air Pollution Prediction

问题提出

文章指出,对于空气质量数据集,无论是在时间维度和空间维度上,都存在着多尺度特性,例如,在时间方面存在短期波动,中期周期性和长期趋势,在空间方面存在城市规模和区域规模。
在这里插入图片描述
如上图(b),某个传感器的读数在1年尺度上显示长期趋势,在1天尺度上显示周期性,在1小时尺度上显示波动。如上图(c)个传感器组成的结构可分为城市尺度图和区域尺度图,城市尺度图每个节点代表一个传感器,区域尺度图每个节点代表一个城市(区域>城市)。由此可见在时间和空间维度上都存在多尺度的特征,据此,作者提出了一个多尺度时空网络(MSSTN)。

网络结构

在这里插入图片描述
MSSTN整体的网络结构比较简单,分为三个子网络:S-Net用来提取多尺度空间特征,T-Net用来提取多尺度时间特征,F-Net进行特征融合并给出最后的预测

S-Net

作者定义了多种图, 每个城市为一个图,即城市规模图,从每个城市中预先挑选一个传感器代表该城市,从而构成一个以城市为节点的区域规模图。
在这里插入图片描述
对不同的图做GCN(ChebNet),得到不同图的空间特征集合。

T-Net

在这里插入图片描述
T-Net的结构类似于TCN,但每层加入了一个门控非线性操作,具体公式如下
在这里插入图片描述
u l u^l ul l l l层的输入的时序信号, ∗ d *d d为扩张卷积, σ \sigma σ为sigmoid激活函数

F-Net

将多尺度时间特征和空间特征和原始输入拼接后作为输入,经过一个多层感知器得到预测结果,为了确保有效的预测范围,作者采用了一个trick( μ \mu μ律对数量化),这块不是很懂

源码

数据集分析

在这里插入图片描述
数据集是以北京为中心的15个城市,文中单独提供了北京(bj)、石家庄(sjz)、太原(ty)、呼和浩特(hhht)、大连(dl)五个城市的数据,以组成城市尺度图(city-scale),加一个区域尺度(region-scale)的数据(mid、midscale)。
在这里插入图片描述
PM2.5中的数据shape为(时序长度,节点数,特征数)

GeoMAN: Multi-level Attention Networks for Geo-sensory Time Series Prediction

问题提出

文章指出,基于地理的时序预测,存在两个复杂的因素:

  • 动态时空关联性
  1. 传感器之间的相关性,即空间相关性
  2. 传感器自身的相关性,即与历史时间的相关性
  • 外部因素
    传感器的读数会受到许多外部因素影响,像天气、时间等。这些因素需要考虑。

针对以上几点,作者提出了一个多级注意力网络(GeoMAN),该网络主要分为两个部分:
多级注意力机制和外部因素融合模块。
注:该网络本质还是单纯的时序预测,即每次都是对一个节点进行预测,只是预测这个结果时用到了空间的信息(所有传感器的属性值),故和交通预测直接得到多个节点的预测值有所不同。
在这里插入图片描述

网络结构

网络采用了编解码的架构,用LSTM为基础单元建模,整个网络结构图如下
在这里插入图片描述

空间注意力

  • 局部空间注意力这里的局部和图卷积上的局部不是一个概念,这里的局部就是指每个传感器多个特征,也就是争对各特征的注意力
    以下就是计算注意力的公式
    在这里插入图片描述
    h 、 s h、s hs分别是LSTM中前一时间步上的隐藏状态和细胞状态, k k k为第k个特征
    在这里插入图片描述
    这里直接将得到各注意力分数乘到各特征上。

  • 全局空间注意力
    这里的全局注意力机制就类似图注意力了(GAT),计算各节点(传感器)之间的相关性。
    类似于局部空间注意力,公式如下:
    在这里插入图片描述
    l l l为第 l l l个传感器。
    同时作者考虑到各传感器之间的地理空间相似性 P i , j P_{i,j} Pi,j(例如以距离的倒数来衡量),同时通过一个可调的超参数 λ \lambda λ来调节两个之间的作用程度
    在这里插入图片描述
    在这里插入图片描述

编码器

编码器由多个LSTM单元组成,在输入每个LSTM单元之前都经过一个空间注意力,空间注意力将局部空间注意力和全局空间进行简单拼接。
在这里插入图片描述

时间注意力

随着编码器的长度增加,编解码的架构的性能会极速下降,为了解决这个问题,作者使用一个时间注意力机制。
在这里插入图片描述
在这里插入图片描述

外部因素融合

作者将多种外部因素(气象特征、时间特征、POIs等)引入进来,用一个简单高效的组件来融合这些因素,得到向量
在这里插入图片描述

解码器

解码器也是用LSTM来实现的,LSTM单元的两个输入分别是上一时间步的隐藏状态,上一步的输出、外部因素融合的向量、时间注意力的输出三者的拼接。
在这里插入图片描述
最终的预测
在这里插入图片描述

Group-Aware Graph Neural Network for Nationwide City Air Quality Forecasting

核心思想

提出城市群的概念,通过一个映射矩阵,讲不同城市按概率映射到不同的城市群,构建城市群图,以此捕获出城市中的一些隐藏依赖

模型结构

在这里插入图片描述
整个模型采用的编解码结构,编码器和解码器的结构类似,分为自注意力网络,可微分分组网络,组关系编码组件

自注意力网络

使用的就是transfromer中的自注意力
在这里插入图片描述
在这里插入图片描述

可微分分组网络

通过矩阵S将原先城市节点分配到不同的组里,注意这里是按概率分配,即每个节点属于所有组,只是所属某个组的概率不同
在这里插入图片描述
如上图6个节点分到两个组,每个节点属于不同组的概率和为1,
在这里插入图片描述
作者在这里引入了城市节点的地理位置信息
在这里插入图片描述
X i X_i Xi为自注意力的输出,L为城市位置信息,i 表示第i个城市,j 表示第j个组,Z表示组的表示

建模城市群之间的依赖关系

根据得到的组的表示Z,求出各组之间的依赖关系,同时引入时间信息
在这里插入图片描述
R i , j R_{i,j} Ri,j表示城市组i和城市组j之间的关系,根据这个依赖关系进行消息聚合和表示更新
在这里插入图片描述
KaTeX parse error: Expected group after '^' at position 2: Z^̲'_i 表示更新后的城市组的表示

建模城市之间的依赖关系

根据更新后的城市组的表示,获取每个城市基于城市组的表示
在这里插入图片描述
然后融合每个城市基于城市组的表示和原先的表示(自注意力的输出),进行消息聚合和表示更新,得到每个城市一个新的表示
在这里插入图片描述

解码器

解码器和编码器一样,但是去掉了最开始的自注意力机制,输入为编码器的输出,即 X 3 X^3 X3,映射矩阵S(解码器中取消梯度更新)、 关系R都采用编码器的结果不变。从而得出预测结果。

K-means对比

为验证可微分分组网络的效果,与k-means进行对比,对不同城市进行分组,同一颜色属于同一组。
在这里插入图片描述
上图可以看出,k-means不能捕获到海风效应,将南海沿海城市分成不同的城市组,而GAGNN则恰好相反,南海沿海城市同色,说明能捕获到这些隐藏的关联。

数据集分析

数据集是作者自己整理的

  • 模型输入x
    在这里插入图片描述
    (数据量,历史时间长度24小时,节点数,特征维度)

  • 模型输出y
    在这里插入图片描述
    (数据量,预测时间长度6小时,节点数)值即为AQI的值。

  • 时间数据u
    在这里插入图片描述
    (数据量,月、周、时三属性)

  • 连接的城市,即边edge_index
    在这里插入图片描述
    (连接的两城市,边的数量)

  • 边的值edge_w
    在这里插入图片描述

  • 经纬度
    在这里插入图片描述
    (城市数,经纬度)


http://www.ppmy.cn/news/661045.html

相关文章

2017第九届北京空气净化及水净化、北京国际节能减排展览会会刊

2017第九届北京空气净化及水净化展览会 2017第九届北京国际节能减排展览会会刊(参展商名录) 展会名称: 2017年第9届中国国际节能减排展览会     所属展馆: 中国国际展览中心(新馆)     开展时间: 2017-04-06 至 04-08 参展…

统计全球每年的最高/最低气温

文章目录 数据准备1.下载数据2.处理数据1.在linux本地目录中创建一个文件夹ncdc2.去下载的目录,然后把数据复制到ncdc中3.解压文件gzip -d *.op.gz4.输出数据到data.txt5.上传到hdfs中 一、统计全球每年的最高气温和最低气温实现思路1.YearMaxTAndMinT2.Mapper:MaxT…

空气质量指数日历史数据

空气质量指数日历史数据 简单易行的空气质量指数日历史数据爬取 效果 图1 目标爬取数据 图2 最终实验效果 目录 空气质量指数日历史数据效果前言I Package 安装与使用II Citys 获取网站内的城市名和对应链接2.1 requsets 网页内容2.2 re 正则提取2.3 url 需爬取的城市月数据网…

K8S环境安装

k8s-安装 K8S环境1. docker基础环境3. 安装k8s5. 离线安装k8s6. 调度策略7. 节点亲和性满足(affinity)8. k8s的一些基础名词8.1 deployment8.2 service8.3 StatefulSet K8S环境 1. docker 移出docker相关的包: sudo yum remove docker \do…

LoRa模块(SX1278)详解

LoRa模块(SX1278) 0. LoRa概述概念LoRa技术的主要特点LoRa技术的工作原理 1. 常见的LoRa模块2. Semtech SX12783. STM32使用SX1278方法示例代码 0. LoRa概述 概念 LoRa(Long Range)是一种长距离、低功耗的无线通信技术&#xff…

炒股软件周期分析怎么调,股票周期设置怎么设置

通达信软件如何设置多周期联动? 通达信炒股软件是一款定位于提供多功能服务的证券信息平台,由深圳财富趋势科技股份有限公司设计的一款移动证券软件。通达信允许用户自由划分屏幕,并规定每一块对应哪个内容。 应答时间:2021-07-…

股市制霸用何利器?股票分析软件横测

想要在风云变幻的股市获得可观的回报,股民们需要有嗅觉灵敏、果断的决策外,一款好的炒股软件辅佐是必不可缺。炒股软件中,除了用户普遍使用的四款 主流,还有不少“非主流”的股票资讯软件,但这些软件均与主流软件实力上…

Windows Phone 7 入门指南(Windows Phone 8已经发布,不过还有一些借鉴意义)

10个月前写的,也搬家于此 本文仅代表个人观点,转载注明出处。 2012年2月9日初版。2012年8月5日更新。 欢迎转载,请著名作者和出处。 前言: 一句话:初次接触Windows Phone,先不要越狱,绑定好Wi…