Delay-Aware Multi-Agent Reinforcement Learning代码分析

news/2024/11/24 20:45:39/

github.com,终于跑出来了我研究生第一个自己跑的python代码吧,虽然还是没有看懂是什么意思,但是代码能运行了,就不错了,説一下文章的几个小的bug。

1 在delay_aware.py中经验回放池中的obs维度改变了==》

replay_buffer = ReplayBuffer(config.buffer_length, maddpg.nagents,[obsp.shape[0] + delay_step*5 for obsp in env.observation_space],[acsp.shape[0] if isinstance(acsp, Box) else acsp.nfor acsp in env.action_space])

这里面我也改过maddpg中的观察维度。但是下面的代码会报错

2 把环境的观察维度obs改了

zero_agent_actions = [np.array([0.0, 0.0,0.0, 0.0,0.0]) for _ in range(maddpg.nagents)]

3 agent.py中的step函数,只有gpu的写法没有cpu的写法。

4 在创建环境中, 把

make_parallel_env(env_id, n_rollout_threads, seed, discrete_action)中的discrete_action去掉了,在这个方法中的所有discrete_action都去掉了。

parser.add_argument("--env_id", default='simple_tag', type=str, help="Name of environment")
parser.add_argument("--model_name", default='model1', type=str,help="Name of directory to store " +"model/training contents") 

加上相应的参数即可

之前在运行代码时,我在配置OpenAI maddpg环境时,我在运行MPE环境中python bin/interactive.py --scenario simple.py,出现这个错误 File "D:\Programfiles\anaconda\envs\maddpg\lib\site-packages\gym\core.py", line 111, in render raise NotImplementedError ,感觉是环境安装有问题,我换自己的电脑就好使了,如果以后知道原因再説吧。


http://www.ppmy.cn/news/427509.html

相关文章

骨传导蓝牙耳机哪个牌子好?最受欢迎的五款骨传导蓝牙耳机

骨传导耳机的出现,有效解决了一些佩戴入耳式耳机就会疼痛的用户,骨传导是通过骨传导技术传递声音,只需挂在耳朵旁的一款佩戴方式,其安全健康、不入耳的听音方式深受大家喜欢,但仍然还是有一些想买骨传导但是不知道选择…

2023年华为HCIE-Dacom认证题库(H12-891)

1、如图所示是某位网络工程师在排查OSPF故障时的输出信息。据此判断,以下哪种原因可能导致邻接关系无法正常建立。 Hello报文发送时间不一致认证密码不一致接口的IP地址掩码不一致区域类型不一致 正确答案:C 2、如图所示,路由器的所有接口开…

dacom蓝牙耳机怎么重置_无线蓝牙耳机 常见八大故障解决办法

【实例1】:主板不启动,开机无显示,有内存报警声("嘀嘀"地叫个不停) 故障原因:内存报警的故障较为常见,主要是内存接触不良引起的。例如内存条不规范,内存条有点薄,当内存插入内存插槽…

骨传导加动圈,这款Dacom耳机有何出众之处?开箱验证

▶前言: 近两年,新生代骨传导耳机可以说是百花齐放,先锋也是尝试了很多款式,从百来元到上千价位的都有。当中也不泛有出色的产品。 最近,先锋又发现了一款骨传导耳机的进化新产物;『Dacom G100骨传导蓝牙…

CodeForces前六场定级赛赋分规则(2020.5修订)及各段位对应分数段

今天仔细看了一下CodeForces初始分的改动办法。 首先,初始分由1500改到了1400,但1400分分配到前六场给予,也就是最初显示为0分。前六场初始分:Promotions of the displayed rating will be equal to 500,350,250,150,100,50 (in …

CCSP2021分赛

12.15 T1看完题目后,直接就暴力了一个70分的解法,(根据以往经验,感觉拿满分还是困难),写了近20分钟,刷新榜发现rank8,第一拿了100分。仍不敢确定后30分难度。 接着看T2,一道题目极长的矩阵复数…

不规则图形数格子的方法_最强大脑第四季不规则数独规则介绍 数独技巧口诀带图解析...

《最强大脑》第四季最新一期的节目中,有四位数独届的高手前来迎接挑战,而挑战成功的选手就要和国外的选手进行PK了,那么本期节目中挑战的数独,规则是什么?还有玩数独有没有小技巧呢?数独的口诀是什么&#…

答题小程序排位赛pk开发功能解析

一、 排位赛基础功能: 1、 Web后台录入赛季信息和答题升级规则,这是程序的重头戏。先设置赛季的开始和结束时间,然后设置出题规则和得分规则,最后设置好段位升级规则。 2、 小程序端可匹配到和自己身份等级相等的对手进行pk答题…