23- TIME-LLM: TIME SERIES FORECASTING BY REPRO- GRAMMING LARGE LANGUAGE MODELS

news/2025/1/18 4:21:42/

解决问题

用LLM来解决时序预测问题,并且能够将时序数据映射(reprogramming)为NLP token,并且保持backbone的大模型是不变的。解决了时序序列数据用于大模型训练数据稀疏性的问题。

方法

Input Embedding

输入: X N ∗ T X^{N*T} XNT,首先对 X i X_i Xi进行均方差归一化,再对 X i X_i Xi进行类似卷积操作的分块,每个分块长度为 L p L_p Lp, 滑动步长为 s s s,那么分块后新的序列长度为
在这里插入图片描述
再将 X p ∈ P ∗ L p X_{p}\in{P*L_p} XpPLp通过线性映射层映射为 X p ∈ P ∗ d m X_{p}\in{P*d_m} XpPdm(相当于将每个段时序信息的数据映射为一个embeding,来描述该时段的信息)。

Patch Reprogramming

将时序数据进行数据对齐,为nlp能理解的信息
文中学习一个 E ′ ∈ V ′ ∗ D E'\in{V'*D} EVD, 其中 V ′ V' V远小于原词典大小,这样可以提升效果。 E ′ E' E在模型中进行学习,学习词典与path的相关性信息。
在这里插入图片描述

再将 E ′ E' E作为attention中的V和K,path embedding作为attention中的Q,这样就可以得到path与每个nlp token之间的相关性。
在这里插入图片描述

Prompt-as-Prefix.

同时在序列特征前面构造一些提示词信息,来帮助学习。

在打包和前馈时,prompt and patch嵌入 O i O_i Oi, 通过如图2所示的冻结LLM,我们丢弃前置Prompt-as-Prefix部分并获得输出表示。在此之后,将它们展平并线性投影,以得出最终预测 Y i Y_i Yi. (丢弃指得是只用他们来计算attention吗,最终输出的embedding表示丢弃掉?)
在这里插入图片描述

整体结构

其中LLM是冻结的
在这里插入图片描述

实验

在few-shot(减少训练集数量)和zero-shot(训练集和测试集不同)都进行了评估,都获得了很好的效果

Reprogramming Interpretation

可以看出,在经过充分的学习之后,不同的patch有不同的语意含义,需要不同的原型来表示。
key

在这里插入图片描述

可以借鉴的点

  • 对序列特征进行滑动窗口的划分,每段有不同的含义,生成对应的embedding
  • 通过学习与nlp词典的相关性来减少词表大小,加速训练

http://www.ppmy.cn/news/1564053.html

相关文章

wow-agent 学习笔记

wow-agent-课程详情 | Datawhale 前两课比较基础,无笔记 第三课 阅卷智能体这一块,曾经做过一点和AI助教相关的内容,也是用了一个prompt去进行CoT,但是风格和课程中的不太相同,在下面附上我的prompt 你是一名资深教…

2025年01月15日Github流行趋势

1. 项目名称:tabby - 项目地址url:https://github.com/TabbyML/tabby - 项目语言:Rust - 历史star数:25764 - 今日star数:1032 - 项目维护者:wsxiaoys, apps/autofix-ci, icycodes, liangfung, boxbeam - 项…

Math Reference Notes: 矩阵性质

矩阵的性质是线性代数中的核心内容,理解这些性质有助于深入掌握矩阵的应用与运算。 掌握矩阵的加法与乘法性质、单位矩阵与零矩阵的作用、转置、逆矩阵、行列式、秩等基本性质,不仅能简化计算过程,还能为更复杂的数学问题提供解决思路&#x…

详解Spring数据缓存注解@Cacheable、@CachePut、@CacheEvict

随着用户群体的扩展,系统所需要处理的数据请求将呈几何式增长,数据库很容易会因为无法处理庞大的请求而产生宕机现象,这对一个软件来说是十分可怕的,而缓存就是解决这一问题的一个方案。缓存的使用将大大提高数据库的承载能力&…

C语言初阶习题【29】杨氏矩阵

1. 题目描述——杨氏矩阵 有一个数字矩阵&#xff0c;矩阵的每行从左到右是递增的&#xff0c;矩阵从上到下是递增的&#xff0c;请编写程序在这样的矩阵中查找某个数字是否存在。 要求&#xff1a;时间复杂度小于O(N); 2. 思路 3. 代码实现1 #include<stdio.h>void fin…

C#调用OpenCvSharp实现图像的开运算和闭运算

对图像同时进行腐蚀和膨胀操作&#xff0c;顺序不同则效果也不同。先腐蚀后膨胀为开运算&#xff0c;能够消除小斑点和细小的突出物、平滑图像以及改善边缘&#xff1b;先膨胀后腐蚀为闭运算&#xff0c;能够去除噪点、填补图像孔洞、连接邻近物体和平滑物体边界。   OpenCvS…

jenkins常用插件和旧版本插件下载——筑梦之路

常用插件 Git Plugin&#xff1a;支持Git版本控制系统&#xff0c;以便从Git仓库拉取代码。几乎所有使用Git作为版本控制的项目都会用到此插件。 Pipeline&#xff1a;允许用户用代码定义整个CI/CD流水线&#xff0c;适合复杂的构建、测试和发布流程。 Blue Ocean&#xff1a…

人工智能任务19-基于BERT、ELMO模型对诈骗信息文本进行识别与应用

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下人工智能任务19-基于BERT、ELMO模型对诈骗信息文本进行识别与应用。近日&#xff0c;演员王星因接到一份看似来自知名公司的拍戏邀约&#xff0c;被骗至泰国并最终被带到缅甸。这一事件迅速引发了社会的广泛关注。该…