论文笔记:UrbanGPT: Spatio-Temporal Large Language Models

embedded/2024/10/19 17:34:30/

1 intro

时空预测的目标是预测并洞察城市环境随时间和空间不断变化的动态。其目的是预见城市生活多个方面的未来模式、趋势和事件,包括交通、人口流动和犯罪率。虽然已有许多努力致力于开发神经网络技术,以准确预测时空数据,但重要的是要注意,许多这些方法严重依赖于拥有足够的标记数据来生成精确的时空表示

不幸的是,数据稀缺问题在实际的城市感知场景中普遍存在。在某些情况下,从下游场景收集任何标记数据变得具有挑战性,这进一步加剧了问题。

因此,建立一个能在多种时空学习场景中表现出强大泛化能力的时空模型变得必要

借鉴大型语言模型(LLM)的显著成就,我们的目标是创建一个能在广泛的城市下游任务中表现出卓越泛化能力的时空LLM

为实现这一目标,我们推出了UrbanGPT,它将时空依赖性编码器与指令调优范式无缝集成。这种集成使LLM能够理解时间和空间的复杂相互依赖性,有助于在数据稀缺的情况下进行更全面、更准确的预测。

为验证我们方法的有效性,我们在多个公共数据集上进行了广泛的实验,涵盖了不同的时空预测任务。结果一致表明,我们精心设计的架构的UrbanGPT始终优于最先进的基准。这些发现突显了为时空学习构建大型语言模型的潜力,特别是在标记数据稀缺的零样本场景中

2 现有挑战

  • 挑战1:稀缺标签数据和重新训练的巨大开销
    • ​​​​​​​​​​​​​​虽然先进时空网络技术在预测方面非常有效,但它们受限于对大量标记数据的需求。
    • 在城市环境中,数据往往难以获得,如全市范围内的交通和空气质量监控代价高昂。
    • 此外,这些模型处理新区域或任务时的泛化能力不足,常需重新训练,以适应新的时空场景
  • 挑战2:LLMs和现有时空模型缺乏零样本场景下的泛化能力
    • ​​​​​​​语言模型LLaMA可基于输入文本对流量模式的推断。
      • 然而,它在处理具有复杂时空依赖性的数字时间序列数据方面存在局限,可能会导致相反的预测结果。
    • 另一方面,预训练的baseline能够很好地编码时空依赖关联,但它们可能因过度拟合原始数据导致在零样本场景下表现不佳​​​​​​​
  • 挑战3:如何将LLMs的出色推理能力扩展到时空预测场景
    • ​​​​​​​时空数据的独特特征与LLMs中所编码的知识之间的存在差距,如何减少这一差距进而建立在广泛的城市任务中具有出色的泛化能力时空大语言模型是一项重大挑战​​​​​​​

3 方法

4 实验

  • zero-shot 场景——通过预测训练阶段未见过的纽约市或芝加哥地区的未来时空数据来评估模型性能。
  • 监督学习场景——使用与训练集相同区域的未来数据评估模型


http://www.ppmy.cn/embedded/6069.html

相关文章

NVIC简介

NVIC(Nested Vectored Interrupt Controller)是ARM处理器中用于中断管理的一个重要硬件模块。它负责处理来自多个中断源的中断请求,并根据中断的优先级来安排处理器执行相应的中断服务例程(ISR)。NVIC是ARM Cortex-M系…

OSPF的P2P和Broadcast

OSPF为什么会有P2P和BROADCAST两种类型 OSPF(开放最短路径优先)协议中存在P2P(点对点)和BROADCAST(广播多路访问)两种网络类型,主要是为了适应不同类型的网络环境和需求。具体分析如下&#xf…

WPF中TextBox失去焦点事件

限制TextBox只能输入整数&#xff0c;而且整数的数值范围为0-100。如果输入101后&#xff0c;弹窗提示输入超限 MainWindow.xaml <TextBox x:Name"textBox1" TextWrapping"Wrap" Text"TextBox" Width"120" Height"50" Lo…

【论文笔记 | 异步联邦】Asynchronous Federated Optimization

论文信息 Asynchronous Federated Optimization&#xff0c;OPT2020: 12th Annual Workshop on Optimization for Machine Learning&#xff0c;不属于ccfa introduction 背景&#xff1a;联邦学习有三个关键性质 任务激活不频繁&#xff08;比较难以达成条件&#xff09;&…

六边形酷科技特效单页源码

源码介绍 基于canvas画布绘制多个六边形追踪鼠标&#xff0c;科技感的几何图形酷炫动画特效&#xff0c; 单页html源码&#xff0c;可以做网站动态背景&#xff0c;喜欢的朋友可以拿去 效果截图 完整源码 <!doctype html> <html> <head> <meta charset…

Python的pytest框架(2)--断言机制

接上篇文章&#xff0c;我们使用pytest框架&#xff0c;实现自动发现并执行用例&#xff0c;接着利用断言语句判断测试结果&#xff0c;最后生成报告。这篇文章我们就断言机制来展开&#xff0c;深入学习进阶pytest框架的断言机制&#xff1a; 目录 一、基本断言 使用Python…

HBase的数据模型与架构

官方文档&#xff1a;Apache HBase – Apache HBase™ Homehttps://hbase.apache.org/ 一、HBase概述 1.概述 HBase的技术源自Google的BigTable论文&#xff0c;HBase建立在Hadoop之上&#xff0c;是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统&#xff0c;用于…

RabbitMQ-核心特性

已经不需要为RabbitMQ交换机的离去而感到伤心了&#xff0c;接下来登场的是RabbitMQ-核心特性!!! 文章目录 核心特性消息过期机制消息确认机制死信队列 核心特性 消息过期机制 官方文档&#xff1a;https://www.rabbitmq.com/ttl.html 可以给每条消息指定一个有效期&#xf…