【论文阅读】基于鲁棒强化学习的无人机能量采集可重构智能表面

news/2024/11/24 1:47:03/
  • 只做学习记录,侵删原文链接

@article{peng2023energy,
title={Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning},
author={Peng, Haoran and Wang, Li-Chun},
journal={IEEE Transactions on Wireless Communications},
year={2023},
publisher={IEEE}
}

《Energy Harvesting Reconfigurable Intelligent Surface for UAV Based on Robust Deep Reinforcement Learning》基于鲁棒强化学习的无人机能量采集可重构智能表面 IEEE Transactions on Wireless Communications一区

    • 论文背景
      • 研究目标
    • 系统模型
      • 通信模型
      • 优化函数
    • 算法设计

论文背景

研究目标

  • RIS每一个反射单元都由无源器件电容、电阻等构成,能耗小、成本低,能单独对信号进行反射。
  • UAV在动态密集的户外活动,如马拉松、音乐会等,提供按需通信服务有巨大潜力。
    • 缺点:
  • RIS:静态部署,当服务覆盖范围中只有少量用户终端(UT)时,使用所有反射阵列进行信号传输可能导致资源浪费。
  • UAV:临时基站(BS)、辅助物联网(IoT),增强热点覆盖,但电池容量限制。
    • 目标 :这项工作是使无人机和智能反射面结合,旨在在有限的时间范围内最大限度地提高UAV–RIS的总能量收集效率,同时满足用户所需的最小吞吐量约束

系统模型

在这里插入图片描述
在这里插入图片描述

  • 两个维度
    1. 只考虑时间:分为两个阶段
      (1)能量传输阶段(2)信号传递阶段
    2. 考虑时间和空间
      (1)能量传输阶段(2)信号传递阶段:在该阶段还考虑智能反射面哪些反射元件用于能量收集。

通信模型

在这里插入图片描述

优化函数

下图中只写出了时空两个维度的,单一时间维度的类似。
在这里插入图片描述
在这里插入图片描述

算法设计

本文使用到强化学习的SD3算法,该算法是TD3算法的优化(求Q值引入Softmax),下图对比了TD3算法和DDPG算法,并简单列出了SD3算法的推导过程。
在这里插入图片描述

  1. TD3改善DDPG高估的问题。
    在这里插入图片描述
  2. SD3算法改善TD3算法的低估问题。推导过程如下(其中为便于计算机求解原算法将积分问题使用了重要性采样):
    在这里插入图片描述
  3. 马尔科夫元组个元素。
    在这里插入图片描述
    实验部分不在此是赘述,感兴趣可以阅读原文。

http://www.ppmy.cn/news/69575.html

相关文章

双飞翼布局实现

是什么? 双飞翼布局是一种常见的网页布局方式,具有两个侧边栏和一个中间内容区域。 与圣杯布局不同的是,双飞翼布局将三个部分放在同一层级的div中,而且左右两个侧边栏的宽度可以不固定,适应更加灵活。 实现方式 方式…

YOLO-NAS:一种新的 YOLO 目标检测模型性能优于 YOLOv6 和 YOLOv8

什么是 YOLO-NAS? YOLO-NAS 是一种新的实时最先进的对象检测模型,在 mAP(平均精度)和推理延迟方面优于 YOLOv6 和 YOLOv8 模型。 YOLO-NAS 是<

SQL——索引

&#x1f4a1; 索引 在关系型数据库中&#xff0c;索引是一种单独的、物理上的对数据库表中的一列或多列的值进行排序的一种存储结构&#xff0c;他是某个表中的一列或着若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单&#xff08;类似于图书目录&#x…

Prompt 指南

https://github.com/OleNet/YouPromptMe/tree/gh-pages/you-prompt-me 这是一份如何调整 Prompt 得到更漂亮的图片的经验性文档。结果和经验都来源于文心 ERNIE-ViLG Demo 和社区的资料。 极乐迪斯科里的猫,故障艺术 呼吁与准则 机器生成图片的最终目的还是便捷地为人类创造…

Go数据结构----队列操作

四、实现数组队列ArrayQueue 队列先进先出&#xff0c;和栈操作顺序相反&#xff0c;我们这里只实现入队&#xff0c;和出队操作&#xff0c;其他操作和栈一样。 package mainimport "sync"// 数组队列&#xff0c;先进先出 type ArrayQueue struct {array []strin…

pyinstaller 打包 py脚本中有子进程的问题

打包成的exe会开启一个一模一样界面的子进程 在if __name__ __main__: 中加入&#xff1a;multiprocessing.freeze_support()

【Linux】多线程概念再理解

文章目录 1. 物理内存与磁盘的关系如何理解物理内存&#xff1f;凭什么物理内存要分为一个个4KB大小&#xff1f;若以块方式存储&#xff0c;则多出的空间是否浪费&#xff1f; 2. 虚拟地址到物理地址的转换3. 缺页中断4. 为什么字符常量区是不允许被修改的&#xff1f;5. 线程…

记一次springboot项目漏洞挖掘

前言 前段时间的比赛将该cms作为了题目考察&#xff0c;这个cms的洞也被大佬们吃的差不多了&#xff0c;自己也就借此机会来浅浅测试下这个cms残余漏洞&#xff0c;并记录下这一整个流程&#xff0c;谨以此记给小白师傅们分享下思路&#xff0c;有错误的地方还望大佬们请以指正…