用于高频交易预测的最优输出LSTM

news/2024/12/22 9:12:06/

用于高频交易预测的最优输出LSTM

J.P.Morgan的python教程

Content

本文提出了一种改进的长短期记忆(LSTM)单元,称为最优输出LSTM(OPTM-LSTM),用于实时选择最佳门或状态作为最终输出。这种单元采用浅层拓扑结构,具有最小的回顾期,并且支持在线训练。通过在美国和北欧股票的限价单簿(LOB)中进行测试,证明了OPTM-LSTM在高频交易预测任务中的有效性,特别是在预测LOB中间价格方面,相较于其他循环神经网络,它具有更低的预测误差。

第一章:引言(Introduction)

高频交易(HFT)在美国股票市场交易活动中占比超过50%。HFT过程中,信号和交易在几纳秒内分析和执行,这种速度要求为参与者提供了利用其基础设施和专业技术知识的机会。文章中提到了限价单簿(LOB)的概念,这是HFT活动的一种形式,其中流动性提供者和流动性接受者形成订单流动动态。文章还涉及了快速订单流动信息分析的重要性,特别是预测限价单簿的下一个中间价格,这是实验协议的主要目标。预测下一个中间价格等同于在线或逐刻预测,这在数据规模消化和时间不规则性检查方面是一个挑战。这些挑战可以通过特定类型的神经网络(NN)适当处理,特别是循环神经网络(RNN)家族中的长短期记忆神经网络(LSTM)。LSTM在多个领域,包括金融和算法交易中,已经显示出良好的预测能力。文中还提到了HFT LOB数据集的研究需要模型能够解析所有相关信息而无处理延迟。此外,文章讨论了构建实时在线机器学习实验协议的挑战,不仅仅是工程目标(即LOB的中间价格预测),还包括开发适合基于较少训练周期的短期训练的动态调整的NN。

第二章:相关工作(Related Work)

LSTM网络已被用于预测中间价格的变动,并在预测能力方面表现优异。此外,通过引入注意力机制,LSTM的预测性能得到了进一步提升。还有研究将LSTM与注意力机制结合,用于预测股票价格的跳跃。LSTM还被用于市场做市策略的实施。LSTM单元的架构基于一系列预定义的操作,这些操作基于对内部计算顺序、门/状态数量和单元输出信息的假设。文中提到了一些研究,这些研究根据信息流调整LSTM内部门的顺序,但这些方法存在一些限制,例如调整或消除RNN门并不直接与最终预测目标相关联。此外,文中还提到了一些简化的LSTM单元结构,以及对LSTM单元中最重要的门进行修改的建议。还有一些研究提出了更轻量级的RNN单元。文中还提到了LSTM网络的更复杂变体,例如peephole LSTM和双向LSTM,这些变体在预测开盘、最高、最低和收盘股票价格方面有效。LSTM还被用作混合模型,与CNN结合用于股票价格预测。尽管这些模型在预测方面表现出色,但它们在处理高速信息流时不够灵活,因为LSTM单元在训练和学习期间保持静态,并且与预测任务脱节。

第三章:提出的方法(Proposed Method)

高频交易限价单簿(LOB)的行为特征是股票库存的快速变化,这直接影响股票价格。为了有效应对这种动态变化,提出的长短期记忆(LSTM)网络需要能够迅速识别这些变化并提供优化的建议或信息。

图片

文章提出了一种自适应的LSTM单元架构,称为OPTM-LSTM单元,它与现有的RNN单元在两个关键方面有所不同:首先,LSTM单元的门和状态被视为特征,并通过内部特征重要性机制来衡量它们处理在线信息流的能力;其次,该机制作为一个非预测性监督回归问题,依赖于代表当前已知LOB中间价格的标签。

图片

OPTM-LSTM单元的核心思想是改进LSTM单元的原始机制,通过在线评估内部门和状态的重要性来重新排列和选择LSTM单元的最终输出。这一过程涉及到一个内部的非预测性监督回归问题,该问题与主要的预测目标(即预测下一个中间价格)相似但不相同。

OPTM-LSTM单元的工作机制基于两个关键组件:简单的优化方法(遵循梯度下降学习算法)和非预测性监督回归问题。这两个组件在LSTM单元内部结合,优化结果随后传递给下一个LSTM单元。

在结构上,OPTM-LSTM单元包含与原始LSTM单元相同数量的门和状态,以及相同数量的输出。不同之处在于,在生成两个输出张量(即时间t的隐藏和细胞状态)之前,会进行一个基于内部非预测性监督回归的特征重要性计算。

特征存储库(Feature Repo)是一个包含六个内部门和状态的集合,基于梯度下降学习算法更新的梯度权重这些组件结合在一起,通过计算每个内部门或状态的平均重要性来确定哪个状态或门是最重要的特征。

图片

此外,文章还提供了在线梯度下降算法的描述,以及对OPTM-LSTM单元的时间和空间复杂性的分析。这包括前向传播和反向传播(BPTT)的复杂性分析。

图片

LSTM架构的主要优势在于包括保留信息和延迟梯度消失或爆炸的问题。文章还提到了通过实验方法观察到的LSTM单元内部状态和门的行为特征,这些观察结果支持了开发OPTM-LSTM单元的决策。

第四章:实验(Experiments)

实验部分旨在验证OPTM-LSTM单元在高频交易(HFT)预测任务中的性能。实验的目标是预测限价单簿(LOB)的下一个中间价格,这是一个在线回归预测任务,不依赖于时间信息,而是依赖于每个交易事件的最新信息。

数据集和实验协议:

  • 实验使用了包括美国和北欧的高流动性和低流动性股票的数据集,数据遵循ITCH协议,确保了市场数据的超低延迟。

  • 数据集涵盖了2015年的前两个月的两支美国股票和2010年的两支北欧股票的交易数据。

  • 实验采用了渐进式训练方法,训练集包含高达2000万次交易事件,测试集则使用了1000次交易事件。

性能评估:

  • 性能通过均方误差(MSE)来评估,这是衡量预测准确性的常用指标。

  • 实验结果基于原始数据和两种不同的数据归一化方法:最小-最大归一化(MinMax)和Z分数标准化(Zscore)。

实验设置:

  • 实验比较了OPTM-LSTM单元与其他几种循环神经网络(RNN)结构,包括标准LSTM、带有注意力机制的LSTM、双向LSTM、GRU以及LSTM和CNN的混合模型。

  • 还包括了两个基线模型:一个基于LOB数据输入的朴素回归器和一个基于中间价格的持续性算法。

训练和测试:

  • 训练过程采用了在线学习的方法,其中模型在每个交易事件后立即更新。

  • 测试过程则是在训练集之后立即进行,以评估模型对新数据的预测能力。

结果:

  • OPTM-LSTM在多个数据集上展示了较低的MSE分数,表明其在预测任务中的优越性能。

  • 与其他RNN模型相比,OPTM-LSTM在不同的数据大小和归一化设置下均表现出更好的稳定性和预测准确性。

图片

图片

局限性和未来研究方向:

  • 尽管OPTM-LSTM在实验中表现出色,但研究的局限性在于所使用的股票数量有限,且交易时间范围受限。

  • 未来的研究可以探索更广泛的股票样本和更长的交易时间范围,以及将OPTM-LSTM应用于其他在线预测任务的可能性。

第五章:总结和未来研究方向(Conclusion and Future Research)

本文总结了OPTM-LSTM单元在高频交易(HFT)预测任务中的优势,包括其在多个数据集上实现的低预测误差和快速适应市场变化的能力,并指出了研究的局限性,如股票样本数量和交易时间范围的限制,同时提出了未来研究的方向,例如将OPTM-LSTM应用于其他在线预测任务,以及进一步优化模型以处理更广泛的市场数据和交易场景。


http://www.ppmy.cn/news/1534904.html

相关文章

【Linux】环境变量(初步认识环境变量)

文章目录 1. 环境变量1.1 基本概念 2. 认识常见环境变量2.1 PATH2.2 HOME2.3 SHELL2.4 PWD2.5 USER 3. 理解环境变量 1. 环境变量 在main函数的命令行参数中,有argc、argv、env三个参数。 argc:命令行参数的个数argc:存放每个参数的具体数值…

Windows11系统下SkyWalking环境搭建教程

目录 前言SkyWalking简介SkyWalking下载Agent监控实现启动配置SkyWalking启动Java应用程序启动Elasticsearch安装总结 前言 本文为博主在项目环境搭建时记录的SkyWalking安装流程,希望对大家能够有所帮助,不足之处欢迎批评指正🤝&#x1f91…

系统架构设计师-下午案例题(2022年下半年)

1.试题-(共25分):阅读以下关于软件架构设计与评估的叙述在答题纸上回答问题1和问题2。 【说明】某电子商务公司拟升级其会员与促销管理系统,向用户提供个性化服务,提高用户的粘性。在项目立项之初,公司领导层一致认为本次升级的主要目标是提…

大厂面试真题-介绍以下Docker的Overlay网络

Overlay网络,又称为叠加网络或覆盖网络,是一种在现有物理网络(Underlay网络)之上构建的虚拟网络架构。它通过虚拟化技术,在不对基础网络进行大规模修改的条件下,实现应用在网络上的承载,并能与其…

智能视界·大模型驱动视频矩阵管理系统

开头先配两张ER图 一张不带字段,一张带字段,剩下的内容按需拿取 1.产品介绍 产品名称: 智能视界大模型驱动视频矩阵管理系统 主要功能: 智能视频分析与识别 功能介绍:该系统集成先进的人工智能大模型,能…

房屋水电费记账本:内置的数组数据击按钮不能删除,页面手动添加的可以删除

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>房租水电费记录</title><script type&qu…

FANUC机器人—PCDK

前言 FANUC提供了一种使用其 PC 开发人员套件 &#xff08;PCDK&#xff09; 从 PC 命令和配置机器人的简单方法。该套件允许 PC 访问机器人上的变量、寄存器、IO、程序、位置和警报&#xff1b;接下来&#xff0c;我将如何开始使用 C#。 连接到机器人 将以下突出显示的行添加…

函数的概念

在JavaScript中&#xff0c;函数是一个核心概念&#xff0c;代表一段可重用的代码&#xff0c;用于执行特定的任务或计算。函数不仅可以简化代码的复杂性&#xff0c;还可以提高代码的可读性、可维护性和模块化程度。以下是关于JavaScript函数的详细介绍。 函数的基本概念 定义…