基于金融新闻微调大语言模型,进行股票回报预测

ops/2025/1/15 0:20:33/

“Fine-Tuning Large Language Models for Stock Return Prediction Using Newsflow”

论文地址:https://arxiv.org/pdf/2407.18103

摘要

本文研究了利用金融新闻流对大型语言模型(LLMs)进行微调,以用于预测股票回报的效果,并突出了回报预测在量化投资中的关键作用。文中描述的模型由文本表示和预测组件构成,并对比了编码器与解码器模型的不同效果。

研究发现指出:

  • 通过聚合LLM的token级嵌入表示可以改善长短期组合的回报预测能力。
  • 对于较大的投资组合,解码器模型显示出更佳的表现;而在较小的投资范围内,则未见明显的性能差异。
  • 相较于传统的基于情感分析的评分,LLM提供的文本表示在构建投资组合时表现出更优的性能。

该研究证明了通过微调LLM来进行回报预测和优化投资组合构建的潜力。

简介

量化投资依赖于从市场价格、经济数据和金融文本等多种来源中提取量化的特征,以构建有效的投资组合。随着自然语言处理技术的进步,金融新闻文本数据在量化投资中的作用日益凸显。大型语言模型(LLMs)因其在语言理解和生成任务上的卓越表现,能够通过特定领域的微调来支持投资相关应用。

本文专注于使用金融新闻来预测股票回报,从而辅助投资组合的构建。传统上,利用金融新闻的方法涉及复杂的特征提取与验证流程,这不仅耗时而且需要额外的数据处理。相比之下,LLMs可以产生可以直接用于预测分析的文本数值表示,因此本文探讨了通过微调这些模型,实现从新闻内容直接到股票回报预测的转变。

本文的主要贡献如下:

1. 开发预测框架:

  • 设计了一种基于大型语言模型(LLM)的股票回报预测模型。
  • 该模型包含两个核心模块:文本表示模块和预测模块。

2. 对比模型表现:

  • 比较了不同类型的LLMs在股票回报预测中的性能差异,具体为编码器模型(例如DeBERTa)和解码器模型(例如Mistral, Llama3)。

3. 提出整合策略:

  • 提出了两种方法将LLM生成的token级表示整合到预测模块中:
  • 瓶颈层方法:通过一个瓶颈层来压缩信息,从而更好地适应预测任务。
  • 聚合表示法:对token级表示进行聚合,以产生更高层次的特征表示。

4. 实证研究与评估:

  • 使用真实的金融新闻数据集,在不同的投资领域进行了广泛的实验。
  • 评估了模型的预测误差,以及根据回报预测构建的投资组合的回测表现,以检验模型的实际应用效果。

01相关工作

先前的研究已经探索了利用金融文本数据进行预测的各种方法,涵盖了情感分析和文本表示学习等领域。大型语言模型(LLMs),例如BERT和GPT-3,为量化投资中的文本数据分析带来了新的途径。这些模型通过大规模预训练来捕捉语言的模式,并借助提示工程和任务特定的微调来优化其在不同应用场景中的表现。有研究者将LLMs用作特征提取工具,应用于金融领域的情感分析和新闻因素的提取。本文则专注于对LLMs进行微调,旨在直接建立金融新闻文本与股票数值回报之间的关联,并评估不同类型LLMs生成的文本表示在这一任务上的效果。

02通过LLM从金融新闻学习股票投资组合

问题建模

投资组合的选择基于定量分析,从一个股票集合U中挑选出子集,并定期进行更新。设r s,t+ℓ为股票s在时间t之后的ℓ步预测回报,新闻文本x s,i用于辅助这一预测。在时间t时,通过使用时间窗口W内所有相关新闻文本{ x s,i } i ∈T s,<t,我们构建了用于回报预测的数据集。这些新闻文本被串联成一个序列X s,<t,然后通过文本表示模块g(·)和预测模块f(·)来建立回报预测模型。训练该模型时使用的是数据实例对{(r s,t+ℓ , X s,<t )},而在测试阶段,则会评估预测误差并根据结果选择股票。

对于长期投资组合,我们的目标是选出预期会上涨的股票,依据回报预测的排名选取前K只股票加入组合。而长短期投资组合则采取更为综合的方法,不仅包括预期上涨的前K只股票,同时也包含预计会下跌的后K只股票,以实现多空双向的投资策略。

方法

大型语言模型(LLMs)可以分为三类:仅编码器(encoder-only)、仅解码器(decoder-only)和编码器-解码器混合型(encoder-decoder)。这三种模型通过不同的预训练目标来生成文本的高维向量表示。仅编码器LLMs采用掩码语言模型进行预训练,通过遮蔽部分令牌并预测这些缺失的部分,从而生成包含前后上下文信息的表示。而仅解码器LLMs则利用自回归的方式,预测下一个令牌,其表示基于之前看到的所有令牌。

在微调过程中,瓶颈(Bottleneck)表示方法将序列信息压缩成一个单一的向量。对于仅编码器LLMs而言,结束序列(EOS)令牌与掩码令牌的作用相似,有助于有效总结整个序列的特征。相比之下,仅解码器LLMs的最后一个令牌已经自然地汇总了整个序列的信息,因此EOS令牌显得多余。为了解决最后一个令牌表示可能失效的问题,提出了一种替代的瓶颈表示方法——聚合所有令牌的表示,比如使用简单的平均策略。

当使用聚合表示时,对于仅编码器LLMs,预训练阶段和微调阶段之间存在差异,因为在预训练中每个令牌的表示是基于被遮蔽的令牌,而在微调时则是基于上下文和自身。对于仅解码器LLMs,对所有令牌表示取平均可能会导致偏向于输入序列早期的令牌,因为早期令牌在自回归设置中会反复影响后续令牌的表示。实验中使用了DeBERTa、Mistral-7B和Llama38B模型,并采用了均方误差(MSE)作为损失函数。

03实验

数据

本研究的数据集涵盖了2003年至2019年间公司级别的金融新闻,涉及北美、欧洲以及新兴市场的投资信息。

设置

在构建投资组合时,长期投资组合选择了预测排名处于第9分位数的股票,并给予所有入选股票等权重。长短期投资组合则同时纳入了第9分位数(预期上涨)和第0分位数(预期下跌)的股票,同样采用等权重分配。我们进行了每月一次的再平衡回测,对比了不同大型语言模型(LLM)的预测效果与基于情感分析的投资策略(如使用FinBERT和FinVADER构建的组合)。

评估指标

为了评估模型的表现,我们采用了多个指标:分位数均方根误差(RMSE)、准确率和收益,还通过累计收益图展示了投资组合的表现,并计算了年化收益和夏普比率等性能统计数据。

结果

针对北美市场,我们的研究发现,采用聚合表示方法的模型在第9分位数上的收益通常优于使用瓶颈(Bottleneck)表示的模型,即使其RMSE可能更高。对于第0分位数,由于其低收益特性对长短期组合有利,虽然聚合表示在此分位数的表现不及瓶颈模型,但整体上长短期组合的表现有所提升。编码器和解码器类型的LLM比较显示,在北美市场上,聚合表示的效果要好于瓶颈表示;而欧洲和新兴市场的相关结果可以在附录中找到。

解码器模型Mistral和Llama在第9分位数(预期表现最佳的股票)中表现出色,但在第0分位数(预期表现最差的股票)中的预测准确性较低。这一特点使得它们在累积回报图中超越了单纯的长仓组合以及长短仓组合。对于长仓组合而言,编码器和解码器类型的LLM表现相当;然而,在长短仓组合中,DeBERTa模型的短仓部分未能有效识别出表现不佳的股票,从而拖累了整体组合的表现,这突显了精确选股的重要性。

所有基于预测模型构建的投资组合回报均超过了市场平均水平。与传统的情绪分析基础组合相比,这些基于预测的组合不仅在回报率和夏普比率方面表现更优,而且其回报曲线更加平滑,显示出更低的波动性,尤其是在加入了短仓策略之后。这表明预测模型能够更有效地解析金融文本信息,提高了对未来股票表现的选股能力。

04总结

本文研究了通过处理金融新闻流来预测投资回报,从而优化量化投资策略的方法。实验采用了调整后的大型语言模型(LLM)直接分析新闻文本和股票未来回报之间的关系。

结果表明:

  • 通过聚合LLM的token级嵌入可以改善投资组合的表现。对于广泛的市场投资,基于解码器架构的LLM预测模型展现出更强大的性能;
  • 而在较小的投资范围内,没有明显的模型优势。
  • 与传统的市场情绪评分相比,LLM提供的文本表示在预测回报方面提供了更强的信号。

进一步的研究方向可能包括探讨为何DeBERTa在较大规模的投资范围内表现不如预期,以及它在不同细分市场中的具体表现。此外,还可以评估最近提出的大型编码器LLM在这一领域中的应用效果。


http://www.ppmy.cn/ops/150143.html

相关文章

社群团购项目运营策略的深度剖析:融合链动2+1模式、AI智能名片与S2B2C商城小程序的综合应用

摘要&#xff1a;随着互联网技术的飞速发展和消费者购物习惯的不断变化&#xff0c;社群团购作为一种新兴的商业模式&#xff0c;正逐渐成为连接供应商、商家与消费者的重要桥梁。然而&#xff0c;社群团购的成功并非仅限于线上运营&#xff0c;其关键在于项目整体运营的优劣&a…

小结:路由器和交换机的指令对比

路由器和交换机的指令有一定的相似性&#xff0c;但也有明显的区别。以下是两者指令的对比和主要差异&#xff1a; 相似之处 基本操作 两者都支持类似的基本管理命令&#xff0c;比如&#xff1a; 进入系统视图&#xff1a;system-view查看当前配置&#xff1a;display current…

39_Lua选择结构语句

Lua语言提供了多种选择结构语句,用于根据不同的条件执行不同的代码块。在条件为true时执行指定程序代码,在条件为false时执行其他指定代码。以下是典型的流程控制流程图。 控制结构的条件表达式结果可以是任何值,Lua认为false和nil为假,true和非nil为真。要注意的是,Lua中…

WINFORM - DevExpress -> DevExpress总结[安装、案例]

安装devexpress软件 路径尽量不换&#xff0c;后面破解不容易出问题 vs工具箱添加控件例如: ①使用控制台进入DevExpress安装目录: cd C:\Program Files (x86)\DevExpress 20.1\Components\Tools ②添加DevExpress控件&#xff1a; ToolboxCreator.exe/ini:toolboxcreator…

Hadoop3.x 万字解析,从入门到剖析源码

&#x1f496; 欢迎来到我的博客&#xff01; 非常高兴能在这里与您相遇。在这里&#xff0c;您不仅能获得有趣的技术分享&#xff0c;还能感受到轻松愉快的氛围。无论您是编程新手&#xff0c;还是资深开发者&#xff0c;都能在这里找到属于您的知识宝藏&#xff0c;学习和成长…

js:正则表达式

目录 正则表达式的语法 定义 检测 检索 元字符 边界符 量词 字符类 表单判断案例 修饰符 过滤敏感词 正则表达式是一种用于匹配和操作文本的强大工具&#xff0c;它是由一系列字符和特殊字符组成的模式&#xff0c;用于描述要匹配的文本字符组合模式 正则表达式是一…

怎么抓取IOS手机app的网络流量,也就是iphone手机抓包

继续昨天的教程&#xff0c;如抓取ios手机上的https请求。今天介绍如何在抓取iphone手机上的非https请求 也就是socket通信的数据。如果在pc上我们会第一时间讲到wireshark&#xff0c;但是对移动设备&#xff0c;似乎就要复杂很多。最近研究发现的工具嗅探大师&#xff0c;能…

Golang——数组、Slice、Map、Channel的并发安全性

本文详细介绍Golang常用数据类型的并发安全性&#xff0c;特别是复合数据类型&#xff08;数组、Slice、Map、Channel&#xff09;的并发安全性。 文章目录 线程安全&#xff08;Thread Safety&#xff09;定义1. 数组非并发安全性高并发下的使用注意示例并发写入数组&#xff…