(论文阅读笔记)Network planning with deep reinforcement learning

news/2024/11/20 21:18:23/
[1] ZHU, Hang, et al. Network planning with deep reinforcement learning. In: Proceedings of the 2021 ACM SIGCOMM 2021 Conference. 2021. p. 258-271. Citation: 25

文章目录

  • Q1 论文试图解决什么问题?
  • Q2 这是否是一个新的问题?
  • Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?
    • 1. 网络优化问题
    • 2. 强化学习解决的优化问题
  • Q5 论文中提到的解决方案之关键是什么?
  • Q6 论文中的实验是如何设计的?
  • Q9 这篇论文到底有什么贡献?

Q1 论文试图解决什么问题?

本论文解决网络规划的问题。网络规划涉及IP层和光层的跨层决策,cross-layer scheduling是一个很有挑战性的问题。

Q2 这是否是一个新的问题?

这不是一个新问题,早在1994年的论文Genetic algorithms in optimal multistage distribution network planning提出用遗传算法进行对网络的规划。规划的网络必须满足运营商指定的某些服务期望,其中包括性能要求(例如,为给定的流量矩阵提供足够的带宽)和可靠性要求(例如,对故障的稳健性)。

下图描述了网络规划问题:在三种单光纤故障中的任何一种情况下,满足从A到D的100Gbps流量的网络规划实例。(a) 短期规划使用两条IP链路A-B-C-D和A-E-F-D。(b) 长期规划增加一条新的光纤B-F,并使用两条IP链路A-B-C-D和A-B-F-D。

在这里插入图片描述

Q4 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?

可主要按照以下两类来分:

1. 网络优化问题

[15] O. Gerstel, C. Filsfils, T. Telkamp, M. Gunkel, M. Horneffer, V. Lopez, and A. Mayoral. Multi-layer capacity planning for ip-optical networks. IEEE Communications Magazine, 2014.
[20] R. Hartert, S. Vissicchio, P. Schaus, O. Bonaventure, C. Filsfils, T. Telkamp, and P. Francois. A declarative and expressive approach to control forwarding paths in carrier-grade networks. In ACM SIGCOMM, 2015.
[23] S. Jain, A. Kumar, S. Mandal, J. Ong, L. Poutievski, A. Singh, S. Venkata, J. Wanderer, J. Zhou, M. Zhu, et al. B4: Experie

2. 强化学习解决的优化问题

[4] I. Bello, H. Pham, Q. V. Le, M. Norouzi, and S. Bengio. Neural combinatorial optimization with reinforcement learning. arXiv preprint arXiv:1611.09940, 2016.
[5] Y. Bengio, A. Lodi, and A. Prouvost. Machine learning for combinatorial optimization: a methodological tour d’horizon. European Journal of Operational Research, 2020.
[7] Q. Cappart, T. Moisan, L.-M. Rousseau, I. Prémont-Schwarz, and A. Cire. Combining reinforcement learning and constraint programming for combinatorial optimization. arXiv preprint arXiv:2006.01610, 2020.
[10] X. Chen and Y. Tian. Learning to perform local rewriting for combinatorial optimization. Advances in Neural Information Processing Systems, 2019.

Q5 论文中提到的解决方案之关键是什么?

提出强化学习算法(NeuroPlan)在IP层和光层做出多项决策,从而进行网络规划。
1)使用图神经网络来编码网络拓扑,解决动态网络给DRL带来的挑战
2)结合ILP的方法,来解决最佳性和可操作性的矛盾
在这里插入图片描述

Q6 论文中的实验是如何设计的?

实验选取的baseline包括ILP和ILP-heur。Metrics包括Optimality(运行时间)和Scalability(是否适用于大规模的网络拓扑)。

Q9 这篇论文到底有什么贡献?

相比于传统的启发式解决方案,该论文是首个提出了用强化学习的方法来解决网络规划问题,并针对强化学习难以面对动态网络环境的问题使用GNN解决。但相比于启发式方法,强化学习存在很多问题,比如训练时间和成本长,收敛慢。


http://www.ppmy.cn/news/739.html

相关文章

一个分布在多次Softmax后,会趋于相同

本文其实是我在知乎上无意中翻到的一条提问:softmax到底有哪些作用?,其中苏剑林大佬关于第四个问题的回复,给我产生了一些思考。为什么一个分布在多次Softmax之后,每个值会趋于相同?例如[1,100]在大约10次S…

LeetCode-50-Pow(x, n)

1、递归 我们最简单的思路就是使用递归,每次就让x乘上Pow(x, n-1)的值。但是这样做的缺点在于递归时间过长会导致超时,因此我们可以使用快速幂进行优化。 快速幂的思想在于我们在求x的N次幂时,不使用x∗xN−1x*x^{N-1}x∗xN−1,…

我们真的需要把训练集的损失降到零吗?

在训练模型的时候,我们需要将损失函数一直训练到0吗?显然不用。一般来说,我们是用训练集来训练模型,但希望的是验证机的损失越小越好,而正常来说训练集的损失降到一定值后,验证集的损失就会开始上升&#x…

Day2多种抓包工具介绍以及使用封包监听工具找到挑战数据包实现发送数据包进行挑战

工具相关证书安装指南 Charles https://blog.csdn.net/weixin_45459427/article/details/108393878 Fidder https://blog.csdn.net/weixin_45043349/article/details/120088449 BurpSuite https://blog.csdn.net/qq_36658099/article/details/81487491 Fiddler: 是一…

Markdown格式表情包大全最新整理分享

Markdown表情包一、前言❤️二、Emoji表情大全👮People(人物)❄️Nature(自然)🔔Objects(物体)🏠Places(地点)🔟Symbols(符…

前端面试题集锦(1)

1、 rem em vw vw 百分比区别 2、app怎么做适配的 3、bfc是什么,清除浮动的原理 4、简单的一个盒子移动到另一个盒子,你用什么方式实现动画效果 5、css 选择器有哪些,权重是什么样的 6、CSS选择符有哪些?哪些属性可以继承&am…

面试:Android中的HOOK方案

Hook方案很多 方案作用时机操作对象优点缺点要求APT编译时:java文件还未编译成class文件.java文件1.可以织入所有类;2.编译时代理,减少运行时消耗1.需要使用apt编译器编译;2.需要手动拼接代理代码(可以使用Javapoet弥补&#xff…

Python预测卡塔尔世界杯身价最高的英格兰要夺冠?!

文章目录🏳️‍🌈 1. 数据🏳️‍🌈 2. 绘图2.1 绘制表头2.2 绘制排名、球队以及国旗2.3 绘制身价柱状图2.4 绘制FIFA排名散点图2.5 设置背景2.6 设置标题🏳️‍🌈 3. 更多可视化项目源码数据:大…