用Python实现时间序列模型实战——Day 15: 时间序列模型的选择与组合

server/2024/12/22 21:51:13/
一、学习内容
1. 模型选择的标准与方法(如 AIC、BIC)

在时间序列建模中,模型的选择是非常重要的,常用的模型选择标准包括 AIC (Akaike Information Criterion)BIC (Bayesian Information Criterion)

  • AIC (Akaike Information Criterion): AIC 衡量模型的拟合优度和复杂度之间的权衡。其公式为:

\text{AIC} = -2 \log(L) + 2k

其中 L 是模型的似然函数,k 是模型参数的个数。AIC 值越小,模型越优。

  • BIC (Bayesian Information Criterion): BIC 是基于贝叶斯信息准则的模型选择标准,公式为:

\text{BIC} = -2 \log(L) + k \log(n)

其中 n 是样本量。BIC 比 AIC 更加倾向于选择简单模型。

2. 时间序列模型的组合预测方法

组合预测 是通过将多个不同模型的预测结果进行加权组合,期望能提高预测准确性。组合预测可以减轻单一模型的局限性,平滑不同模型的偏差。

常用的组合预测方法有:

  • 简单平均法:不同模型的预测结果取平均值。
  • 加权平均法:根据模型的表现,给予不同模型不同的权重。
3. 基于不同模型的加权组合预测

通过使用不同时间序列模型(如 ARIMA、SARIMA、ETS 模型等),可以进行加权组合预测。我们可以使用 AIC 或 BIC 值来决定各模型的权重,权重越低的模型被赋予更大的权重。

二、实战案例

使用不同时间序列模型进行组合预测,在这个案例中,我们将使用 ARIMA、SARIMA 和 Holt-Winters 三种不同的时间序列模型进行组合预测,并比较组合预测与单一模型的效果。

1. 生成模拟时间序列
python">import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.holtwinters import ExponentialSmoothing
from statsmodels.tsa.statespace.sarimax import SARIMAX# 生成模拟的时间序列数据
np.random.seed(42)
n_obs = 150
time = pd.date_range(start='2000-01-01', periods=n_obs, freq='M')
trend = 0.1 * np.arange(n_obs)
seasonal = 10 * np.sin(2 * np.pi * time.month / 12)
noise = np.random.normal(0, 1, n_obs)
data = trend + seasonal + noise# 创建数据框
ts_data = pd.DataFrame({'Date': time, 'Value': data})
ts_data.set_index('Date', inplace=True)# 绘制时间序列
plt.figure(figsize=(10, 6))
plt.plot(ts_data['Value'], label='Original Data')
plt.title('Simulated Time Series Data')
plt.legend()
plt.show()

代码解释:

  • 我们生成了一个含有趋势、季节性和噪声的模拟时间序列。

结果输出:

代码解释:

2. 模型拟合与预测
python"># 构建并拟合 ARIMA 模型
arima_model = ARIMA(ts_data['Value'], order=(1, 1, 1)).fit()
arima_forecast = arima_model.forecast(steps=12)
arima_aic = arima_model.aic# 构建并拟合 SARIMA 模型
sarima_model = SARIMAX(ts_data['Value'], order=(1, 1, 1), seasonal_order=(1, 1, 1, 12)).fit()
sarima_forecast = sarima_model.forecast(steps=12)
sarima_aic = sarima_model.aic# 构建并拟合 Holt-Winters 模型
hw_model = ExponentialSmoothing(ts_data['Value'], trend='add', seasonal='add', seasonal_periods=12).fit()
hw_forecast = hw_model.forecast(steps=12)
hw_aic = hw_model.aic# 绘制各模型的预测结果
plt.figure(figsize=(10, 6))
plt.plot(ts_data.index, ts_data['Value'], label='Original Data')
plt.plot(pd.date_range(start=ts_data.index[-1], periods=12, freq='M'), arima_forecast, label='ARIMA Forecast')
plt.plot(pd.date_range(start=ts_data.index[-1], periods=12, freq='M'), sarima_forecast, label='SARIMA Forecast')
plt.plot(pd.date_range(start=ts_data.index[-1], periods=12, freq='M'), hw_forecast, label='Holt-Winters Forecast')
plt.title('Forecasts of Different Models')
plt.legend()
plt.show()

代码解释:

  • 使用 ARIMA、SARIMA 和 Holt-Winters 三种模型对时间序列数据进行拟合,并对未来 12 个月进行预测。
  • 获取每个模型的 AIC 值,作为模型优劣的评估指标。

结果输出:

3. 加权组合预测
python"># 加权组合预测,权重根据 AIC 值反比计算
total_aic = 1/arima_aic + 1/sarima_aic + 1/hw_aic
arima_weight = (1/arima_aic) / total_aic
sarima_weight = (1/sarima_aic) / total_aic
hw_weight = (1/hw_aic) / total_aiccombined_forecast = arima_weight * arima_forecast + sarima_weight * sarima_forecast + hw_weight * hw_forecast

代码解释:

  • 根据每个模型的 AIC 值,计算各自的权重。AIC 越小,模型越优,因此权重根据 AIC 值的倒数计算。
  • 使用加权组合方法,对三个模型的预测结果进行组合,得到最终的组合预测。
4. 结果可视化
python"># 绘制组合预测结果
plt.figure(figsize=(10, 6))
plt.plot(ts_data.index, ts_data['Value'], label='Original Data')
plt.plot(pd.date_range(start=ts_data.index[-1], periods=12, freq='M'), combined_forecast, label='Combined Forecast', linestyle='--')
plt.title('Combined Forecast Using ARIMA, SARIMA, and Holt-Winters')
plt.legend()
plt.show()# 打印各模型的AIC值和权重
print(f"ARIMA AIC: {arima_aic}, Weight: {arima_weight}")
print(f"SARIMA AIC: {sarima_aic}, Weight: {sarima_weight}")
print(f"Holt-Winters AIC: {hw_aic}, Weight: {hw_weight}")

代码解释:

  • 绘制各个模型的单独预测结果,并绘制加权组合后的预测结果。

结果输出:

ARIMA AIC: 736.542904871795, Weight: 0.00031402143071579
SARIMA AIC: 417.8555476646313, Weight: 0.0005535172574926239
Holt-Winters AIC: 0.23149108424296116, Weight: 0.9991324613117917

 三、结果分析:

  1. AIC 值比较:每个模型的 AIC 值用于评估模型的优劣。AIC 越小,模型的拟合效果越好。
  2. 单一模型预测:我们分别绘制了 ARIMA、SARIMA 和 Holt-Winters 模型的预测结果。
  3. 加权组合预测:最终的组合预测曲线结合了各个模型的优势,提供了更加稳健的预测结果。
四、总结

在本案例中,我们通过 AIC 值选择了最佳的模型,并通过加权组合预测方法,结合了 ARIMA、SARIMA 和 Holt-Winters 模型的预测结果。组合预测能够减轻单一模型可能带来的偏差,通常能提高预测准确性。


http://www.ppmy.cn/server/114267.html

相关文章

手机变身无线话筒

目录 一、APP安装 二、蓝牙连接 三、使用 四、设置 近日学校给教室内安装了贝德的吸顶音响,声音洪亮不刺耳,前后排学生都清晰听到我的声音,上课轻松了很多。 不过这个360吸顶音箱使用无线耳麦,需要定时充电,我总怕没电,每次下班都给它充上电。

计算机网络10——数据库语法1

目录 1、sql语句执行顺序 2、多表查询 3、写sql的步骤 4、去重 5、视图 6、自定义函数:function 7、调用函数 1、sql语句执行顺序 一般情况下:1、from 2、where 3、select 如果有分组和having:from 分组 having最后执行 2、多表查询 内联:select * from 表1 inne…

PostgreSQL技术内幕7:PostgreSQL查询编译

文章目录 0.简介1.整体过程2.查询分析2.1 Lex2.2 Yacc2.3 PG词法分析和语法分析介绍2.4 PG语义分析 4.查询优化4.1 预处理4.1.1 提升子链接和子查询4.1.2 预处理表达式4.1.3 处理HAVING子句 4.2 改进查询树4.2.1 路径生成4.2.2 代价估计 4.3 计划生成 0.简介 一次完整的SQL执行…

一台笔记本电脑的硬件都有哪些以及对应的功能

一台笔记本电脑的硬件通常包括多个关键组件,这些组件共同协作,确保电脑的正常运行。以下是笔记本电脑的主要硬件及其功能: 1. 中央处理器(CPU) 功能:CPU 是电脑的“大脑”,负责处理所有的计算…

分类预测|基于黑翅鸢优化轻量级梯度提升机算法数据预测Matlab程序BKA-LightGBM多特征输入多类别输出 含对比

分类预测|基于黑翅鸢优化轻量级梯度提升机算法数据预测Matlab程序BKA-LightGBM多特征输入多类别输出 含对比 文章目录 一、基本原理BKA(Black Kite Algorithm)的原理LightGBM分类预测模型的原理BKA与LightGBM的模型流程总结 二、实验结果三、核心代码四、…

mycat双主高可用架构部署-MySQL5.7环境部署第一台

MySQL5.7服务器IP是192.168.31.209及192.168.31.210 1、192.168.31.209:3307实例部署 a、配置文件 mkdir -p /data/mysql/mysql3307/{data,logs} #创建MySQL数据及日志目录 vi /data/mysql/mysql3307/my3307.cnf #配置文件整理 [client] #password your_password port …

综合自动化变电所运行的可靠性

摘 要:自动化技术在变电所中的有效利用,一方面能够通过网络信息平台落实远程变电操控的需要,使变电所的工作质量与效率得到显著提升,并增强变电系统的可控性;另一方面,凭借可靠性检测措施,更便于…

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式)&…