时序论文37 | DUET:双向聚类增强的多变量时间序列预测

ops/2025/2/5 3:03:59/

图片

论文标题:DUET: Dual Clustering Enhanced Multivariate Time Series Forecasting

论文链接:https://arxiv.org/pdf/2412.10859

代码链接:https://github.com/decisionintelligence/DUET

(后台回复“交流”加入讨论群,回复“资源”获取2024年度论文讲解合集)

前言

多变量时间序列预测(MTSF)在金融投资、能源管理、天气预测和交通优化等领域具有重要应用。然而,现实中的时间序列通常面临两大挑战:

  • 时间模式的异质性,即由于外部因素的影响,真实时间序列往往表现出非平稳性(Temporal Distribution Shift, TDS),导致其分布和模式发生显著变化;

  • 通道间的复杂关系,即不同通道(变量)之间通常存在复杂且交错的相关性,包括显著相关的通道、噪声通道以及无关通道,这种复杂性使得精准建模变得尤为困难。

近日,来自华东师范大学和丹麦奥尔堡大学的科研人员合作,创新性地提出了一种基于时间和通道双向聚类架构的时间序列预测模型DUET,在多变量时间序列预测领域取得了巨大的突破。DUET创新性的引入了一种时间和通道双向聚类架构,有效解决了时序分布漂移以及多变量时间序列中变量关系难以动态建模的难题。

研究背景

在实际应用中,描述不稳定系统的时间序列往往容易受到外部因素的影响。这种时间序列的非平稳性意味着数据分布会随着时间的推移发生变化,这一现象被称为时间分布漂移(Temporal Distribution Shift, TDS)TDS会导致时间序列呈现出不同的时间模式,这种现象正式被称为时间模式的异质性。

例如,图1(a) 展示了一个经济领域的时间序列,反映了随国际环境变化而产生的波动。

图片

可以观察到,三个时间区间 A、B 和 C 遵循不同的时间分布,这一点可以通过图1 (b)、图1 (c) 和图1 (d) 所示的值直方图得到证明。这种分布的变化伴随着时间模式的差异。正如图1 (a) 所示,蓝色区间 A 呈现下降趋势,绿色区间 B 呈现上升趋势,而黄色区间 C 则表现为更陡峭的下降趋势。

考虑到这些模式在时间序列中的普遍存在,将其纳入建模过程显得尤为重要。然而,近期的研究大多以隐式方式处理时间模式的异质性,这在很大程度上削弱了预测的准确性。

复杂的通道间关系难以灵活建模

多变量时间序列预测任务中,建模不同通道之间的相关性至关重要,因为利用其他相关通道的信息往往可以提升特定通道的预测精度。

例如,在天气预测中,温度的预测可以通过结合湿度、风速和气压等数据得到改进,因为这些因素之间相互关联,可以提供更全面的天气状况信息。

研究人员探索了多种通道策略,包括:将每个通道独立对待 (Channel-Independent, CI); 假设每个通道与其他所有通道相关(Channel-Dependent, CD); 以及将通道分组为若干簇 (Channel-Hard-Clustering, CHC)。

图片

  • CI强制对不同通道使用相同的模型。尽管这一策略具有一定的鲁棒性,但它忽略了通道之间的潜在交互,可能在未见通道的泛化能力和建模容量上受到限制;

  • CD 则同时考虑所有通道,并生成用于解码的联合表示,但可能受到无关通道噪声的干扰,从而降低模型的鲁棒性;

  • CHC 通过硬聚类将多变量时间序列划分为互不相交的簇,在每个簇内使用 CD 建模方法,而在簇之间使用CI方法。然而,该方法仅考虑同一簇内的关系,限制了其灵活性和通用性。

  • 目前尚未有一种方法能够精确且灵活地建模通道之间的复杂交互关系。

核心贡献

  • 为了解决多变量时间序列预测(MTSF)问题,论文提出了一个通用框架——DUET。该框架通过时间维度和通道维度的双向聚类,学习准确且自适应的预测模型。

  • 研究人员设计了时间聚类模块(TCM),将时间序列划分为细粒度的分布簇。针对不同的分布簇设计了多种模式提取器,以捕捉其独特的时间模式,从而建模时间模式的异质性。

  • 通道聚类模块(CCM),通过度量学习在频率域中灵活捕捉通道间的关系,并进行稀疏化处理以抑制噪声通道的影响,从而实现灵活且高效的通道关系建模。

  • 最后,在TFB的25个数据集上进行了广泛实验,实验结果表明,DUET优于现有的最先进基线。此外,所有数据集和代码已公开。

图片

模型框架

时间聚类模块 (TCM)

分布路由器:通过两层全连接网络将时间序列的潜在分布投影到高维空间,利用 Noisy Gating 技术选择最可能的分布簇。

图片

线性模式提取器:将时间序列分解为趋势部分和季节性部分,分别通过线性变换提取特征。

图片

聚合器:利用分布路由器的权重,动态聚合提取的特征,整合为全局时间特征表示。

通道聚类模块 (CCM)

频域通道表示:利用傅里叶变换将时间序列映射到频率空间,以频域特征衡量通道的相关性;使用可学习的Mahalanobis距离构建通道间的关系矩阵。

图片

稀疏化:通过Gumbel Softmax重采样策略,将通道关系矩阵转化为稀疏的掩码矩阵,仅保留对预测任务有益的通道连接。

图片

融合模块 (FM)

使用掩码注意力机制,将时间特征与通道掩码矩阵相结合,以生成最终的特征表示。

图片

实验效果

本文使用 Time Series Forecasting Benchmark (TFB) 代码库作为统一的评估框架,该框架提供了所有基线代码、脚本和结果。按照 TFB 中的设置,为了确保公平对比,我们没有使用"Drop Last"技巧

整体性能

DUET在10个被广泛认可的真实数据集上大幅领先于当前最先进模型。从绝对性能的角度来看,DUET 相较于表现次优的基线模型 PDF,有显著提升,均方误差(MSE)降低了6.9%,平均绝对误差(MAE)降低了 6.2%。

DUET 在应对由时间分布漂移引起的时间异质性问题时表现出卓越的能力。此外,在不同通道策略的对比中,DUET 同样展现了 CSC 策略的显著优势。

图片

图片

消融实验

文中进一步提供了一系列消融实验来验证模型框架设计的合理性。实验表明,DUET的设计在提升模型精度上是有效的。

图片

参数敏感性分析:

DUET根据时间序列的时间分布将其聚类为M类,其中M是模式提取器的数目,研究人员分析了不同M值对预测精度的影响,并得出以下观察结论:

1)当M=1时,模型性能低于M≠1的情况

2)对于来自相同领域的数据集,例如电力领域的数据集ETTh1和ETTh2,最佳M值相同,均为4

3)对于来自不同领域的数据集,例如 ILI(健康领域)和 Exchange(经济领域),最佳N值分别为2和5

4)在选择最合适的M时,模型性能在大多数情况下显著优于其他变体,突显了在时间视角下进行聚类的有效性,并表明来自相同领域的数据集通常具有相似的时间分布,反之亦然。

图片

总结

论文提出了一种通用框架DUET,该框架通过在时间维度和通道维度上引入双向聚类来提升多变量时间序列的预测能力。

DUET集成了一个时间聚类模块(Temporal Clustering Module,TCM),该模块将时间序列聚类为细粒度的分布簇,并针对不同分布簇设计多种模式提取器,以捕捉其独特的时间模式,从而建模时间模式的异质性。

此外,研究人员引入了通道聚类模块(Channel Clustering Module,CCM),采用通道软聚类策略,通过度量学习在频率域中捕捉通道之间的关系,并进行稀疏化处理。

最后,融合模块(Fusion Module,FM)基于掩码注意力机制,将TCM提取的时间特征与CCM生成的通道掩码矩阵高效结合,这些创新机制共同赋予DUET卓越的预测性能。


大家可以关注我【科学最top】,第一时间follow时序高水平论文解读!!!,后台回复“交流”加入讨论群,回复“资源”获取2024年度论文讲解合集


http://www.ppmy.cn/ops/155746.html

相关文章

如何使用 DeepSeek 和 Dexscreener 构建免费的 AI 加密交易机器人?

我使用DeepSeek AI和Dexscreener API构建的一个简单的 AI 加密交易机器人实现了这一目标。在本文中,我将逐步指导您如何构建像我一样的机器人。 DeepSeek 最近发布了R1,这是一种先进的 AI 模型。您可以将其视为 ChatGPT 的免费开源版本,但增加…

图 、图的存储

图的基本概念: 图g由顶点集v和边集e组成,记为g(v,e) 用|v|表示图g中顶点的个数,也称图g的阶,用|e|表示图g中边的条数 线性表可以是空表,树可以是空树,但图不可以是空&…

代码随想录算法训练营第四十二天-动态规划-股票-188.买卖股票的最佳时机IV

题目要求进行k次买卖其实就是上一题的扩展,把2次扩展为k次定义动规数组依然是二维,第一个维度表示第几天,第二个维度表示第几次买入和卖出所以第二个维度的长度应该是2k1在for循环内,要使用一个内循环来表示第几次买入或卖出&…

计算机组成原理——存储系统(二)

🌱 "人生最深的裂痕,往往是光照进来的地方。 别怕脚下的荆棘,那是你与平庸划清界限的勋章;别惧眼前的迷雾,星辰永远藏在云层之上。真正的强者不是从未跌倒,而是把每一次踉跄都踏成攀登的阶梯。记住&am…

WebShell分析

一.WebShell基础 1.简介 介绍:WebShell是一种黑客常用的恶意脚本,主要目的是通过在目标服务器上植入恶意代码,获得执行操作的权限。常见的WebShell编写语言包括: ASPJSPPHP 2.特点 持久化控制 上传WebShell后,黑客能…

基于开源AI智能名片2 + 1链动模式S2B2C商城小程序视角下的个人IP人设构建研究

摘要:本文深入探讨在开源AI智能名片2 1链动模式S2B2C商城小程序的应用场景下,个人IP人设构建的理论与实践。通过剖析个人IP人设定义中的“诉求”“特质”“可感知”三要素,结合该小程序特点,阐述其对个人IP打造的影响与推动作用&…

Node 服务器数据响应类型处理

一、设置不同的响应数据类型 在 Node.js 的 http 模块中,通过 res.writeHead 方法可以设置不同的响应头,以指定响应的数据类型。 1. 纯文本响应 对于纯文本响应,可以将 Content-Type 设置为 text/plain const http require("http&q…

【精选】基于数据挖掘的招聘信息分析与市场需求预测系统 职位分析、求职者趋势分析 职位匹配、人才趋势、市场需求分析数据挖掘技术 职位需求分析、人才市场趋势预测

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…