论文标题:Federated Learning-Based Mobile Traffic Prediction in Satellite-Terrestrial Integrated Networks
作者信息:Weiwei Jiang1,2, Jianbin Mu3, Haoyu Han1,2, Yang Zhang1,2, Sai Huang1,2
-
- Key Laboratory of Universal Wireless Communications, Ministry of Education, Beijing, China
-
- School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing, China
-
- College of Information Engineering, Zhejiang University of Technology, Hangzhou, China
- 对应作者:Jianbin Mu (jianbinmu@zjut.edu.cn)
论文出处:Software: Practice and Experience
摘要
随着卫星和地面网络的发展和融合,移动流量预测变得比以往任何时候都更加重要,它是支持各种垂直应用的服务提供和资源调度的基础。现有的流量预测方法,尤其是基于深度学习的方法,需要大量数据进行模型训练。由于数据隐私问题,移动流量数据不易在不同方之间共享,这使得难以获得精确的预测模型。为了减轻数据泄露风险,本研究提出了一种基于联邦学习的框架,用于卫星-地面集成网络中的移动流量预测,以实现数据隐私和预测精度之间的权衡。在所提出的框架中,本地模型在地面基站进行训练,全局模型在空间中的卫星边缘服务器聚合。通过数值实验验证了所提出的基于深度学习的预测模型,该模型结合了自适应图卷积网络(AGCN)和长短期记忆(LSTM)模块,在联邦学习设置中与其他图神经网络(GNN)变体相比,实现了最低的预测误差。
引言
移动流量预测问题在现代通信网络中具有重要意义。准确的移动流量预测可以帮助运营商更好地理解未来的网络负载条件,合理规划和分配网络资源,包括基站、频谱和传输资源。通过预测移动流量,运营商可以提前采取措施应对网络拥堵和高峰时段,确保用户能够随时享受稳定和高速的移动网络服务。准确的流量预测还有助于运营商制定合理的扩展计划和投资策略,避免过度投资和不必要的成本支出。同时,通过优化网络运营和维护流程,可以降低运营成本。
方法
为了解决数据泄露风险,本研究提出了一种联邦学习框架,用于卫星-地面集成网络中的移动流量预测,以实现数据隐私和预测精度之间的权衡。在所提出的框架中,本地模型在地面基站进行训练,全局模型在空间中的卫星边缘服务器聚合。研究提出了一种基于深度学习的预测模型,该模型结合了自适应图卷积网络(AGCN)和长短期记忆(LSTM)模块,并在数值实验中验证了其有效性。
本节详细介绍了所提出的基于联邦学习的移动流量预测框架,包括框架结构、问题描述、预测模型以及联邦学习方法。
3.1 框架
所提出的联邦学习框架旨在利用卫星和地面网络的优势。在该框架中,大量的设备连接到移动基站,网络流量数据在本地收集和存储。每个移动基站的覆盖范围有限,并且由于额外的数据传输成本,它们不愿意与其他基站共享流量数据。另一方面,卫星节点具有广泛的覆盖范围,可以作为空间中的边缘服务器,具有增强的计算能力。在所提出的联邦学习框架中,本地模型在地面的移动基站进行训练,而全局模型在空间中的卫星边缘服务器聚合。为了保护数据隐私并减少通信数据量,仅在卫星边缘服务器和移动基站之间传输和更新模型参数。
3.2 问题描述
移动流量预测问题被建模为一个时间序列预测问题,其中使用在不同地点收集的历史流量数据作为输入,未来的流量需求是预测目标。假设时间轴被均匀分割成时间槽,用XtXt表示时间槽tt的流量需求,这是预测目标。历史流量数据,输入时间长度为pp,用作输入,即Xt−p,…,Xt−2,Xt−1Xt−p,…,Xt−2,Xt−1。移动流量预测问题涉及确定一个函数ff,将输入映射到预测目标;例如,f(Xt−p,…,Xt−2,Xt−1)=Xtf(Xt−p,…,Xt−2,Xt−1)=Xt。在实践中,外部因素影响不同区域的移动流量需求,如空间接近性、兴趣点、城市功能和社会因素,包括事件和假期。这些外部因素可以用作预测问题公式化的额外输入。
3.3 预测模型
图神经网络(GNNs)已成为分析无线网络中的拓扑和连接模式的强大工具。通过将网络元素(如节点和边)表示为图,GNNs可以学习提取有意义的特征,并通过消息传递和图卷积操作推断空间属性。这使得基于GNN的预测模型能够利用无线网络中丰富的结构信息,对各种网络指标(如链路质量、流量负载和资源分配)进行准确和明智的预测。
- GNN模块:考虑了三种GNN模型作为基础预测模型:GCN、GAT和AGCN。AGCN通过自适应邻接矩阵增强GCN,该矩阵通过高斯核构建的距离矩阵动态生成。
- LSTM模块:LSTM网络是RNN的强大变体,专门设计用于捕获长期依赖关系,并更有效地处理序列数据。LSTM模块使用门机制,包括遗忘门、输入门和输出门,以选择性地存储、读取和忘记信息,使其能够学习序列数据中的复杂模式和关系。
3.4 联邦学习方法
联邦学习是一种分布式机器学习方法,允许多个设备或服务器协作训练模型,而不必将数据集中到一个地方。本研究考虑了同步和异步联邦学习,并采用了FedAvg算法的改进版本,即加权FedAvg算法。在加权FedAvg算法中,每个客户端根据其预测性能被分配不同的权重,这允许更重要或相关的值对整体平均值有更大的影响。这种方法通过为来自不同客户端的模型权重分配适当的权重,减少了异常值或不太相关的模型权重可能引起的偏差。
结果
数值实验表明,所提出的方法在实际移动流量数据集上表现出色,与其他GNN变体相比,具有更低的预测误差。
结论
本文提出了一种基于联邦学习的移动流量预测框架,该框架在卫星-地面集成网络中有效,并且优于其他GNN变体,具有更低的预测误差。本研究的主要贡献包括一个新颖的基于深度学习的移动流量预测网络结构和一个基于联邦学习的移动流量预测框架。具体而言,本研究的贡献如下:
- 提出了一个高效的基于联邦学习的移动流量预测框架,包括卫星边缘服务器和移动基站。
- 提出了一个有效的流量预测模型,利用AGCN模块进行空间依赖性提取和LSTM模块进行时间依赖性提取。
- 提出了一种改进的加权FedAvg算法,根据客户端的预测性能为不同客户端分配不同的权重。