深度强化学习用于博弈类游戏-基础【1】
- 1. 强化学习方法
- 2. 强化学习在LOL中的应⽤
- 2.1 环境搭建
- 2.2 游戏特征元素提取
- 1)小地图人物位置:
- 2)人物血量等信息
- 3)在整个图像上寻找小兵、防御塔的位置
- 4)自编码器提取
- 3. 策略梯度算法简介
- 参考资料
1. 强化学习方法
伴随着人工智能的潮起潮落,强化学习的从最早期的最优控制发展至今,这段时间里存
在两个重要的时间点。第⼀个关键点是 1998年,Alex M. Andrew出版 Reinforcement
Learning:An Introduction。
该书系统地总结了 1998年以前强化学习算法的各种进展。在此之前,学者们关注和发展得最多的算法是表格型强化学习算法,形成了强化学习的基本理论框架。不过这⼀时期基于直接策略搜索的⽅法也被提出来了,如 1992年 R.J.Williams提出了 Reinfo