教AI逐帧搓招玩《铁拳》通关最高难度,现在的街机游戏爱好者有点东西啊

news/2024/11/16 4:38:23/
博雯 发自 凹非寺
量子位 | 公众号 QbitAI

现在的AI都开始学着逐帧搓招打街机了?

《拳皇98》、《街头霸王》、《死或生》……一干童年回忆全都玩了个遍,其中还有号称要打5000场才能入门的3D格斗游戏《铁拳》:

5e6c8871972eb781415f61e46e715e2a.png

没错,就是那个对新手极不友好的《铁拳》,随便拉一张角色的搓招表感受一下这个复杂度:

(没错,各种压帧判定的JF技就是其特色之一)

5a9d157a25bab1f2090b5fa41607cd89.png

铁拳 TT2出招表

但AI偏偏就能在入坑没多久就通关了最高难度

af13eebf8daba3ba0d372f9becfeaf4f.gif

左侧为AI

这款AI的背后是一位个人开发者,也是一位骨灰级的街机游戏爱好者。

他训练出来的新手“铁匠”在Reddit的“比赛录播”已经有近500的热度:

c48e976913423b6694654833dd8c1d02.png

强化学习训练框架

这位AI铁匠的背后,是一个叫做DIAMBRA Arena的强化学习交互框架。

DIAMBRA Arena提供了多个强化学习研究和实验环境,具有情节性的强化学习任务,由离散的动作(如游戏手柄按钮)和屏幕中的像素和数据(如人物血条)组成。

在这一框架中,智能体会向环境发送一个动作,环境对其进行处理,并相应地将一个起始状态转换为新状态,再将观察和奖励返回给智能体,以此交互循环:

468a8694a4a8364d4e5039bae3da9dcc.png

要实现上述循环的代码也非常简单:

这一框架目前支持Linux、Windows、MacOS等主流的操作系统。

而这款AI的“实战场”为早期的Tekken Tag Tournament,当然,搓招复杂度完全不逊色于之后的新版本……

ed1a9874421bd1adaf20ff98c2e9f717.png

开发者选择了风间仁(Jin)和吉光(Yoshimitsu)两名具有代表性的角色作为主要操作对象。

输入分别为:从RGB转换为灰度,并缩小到128 x 128px的游戏屏幕像素值、对战局数(Stage)、人物血条、游戏界面的一侧。

训练中的奖励是一个基于生命值的函数,如果对方生命值损伤则得到正面奖励,己方控制的角色生命值损失则得到负面惩罚。

同时,AI的动作速率也被限定为最大速率的1/10,即游戏中每6步发送一个动作。

由于框架使用的是一种离散的动作空间,因此,智能体在训练中的同一时间只能选择一个移动动作9向上,向下等)或攻击动作(冲击,踢,出拳)。

因此,虽然一个连击组合的实战能力更强,但由于AI无法同时点击两个动作,在真实的对战中,便会出现AI频繁使用踢(Kick)和更换角色(swap)两个动作的情况:

281db403535c615e12414f314321a471.gif

评论区有资深PVP爱好者表示,想要看到这种顶级AI选手互虐的激烈场景,而开发者本人对此非常赞同:

我们正在创建一个平台,在这个平台上,程序员将提交他们训练有素的AI并互相对抗,并在我们的频道上播放比赛。

155991dd004c23efa1470e92dc3a0314.png

AI锦标赛

现在,开发者团队已经开始正式筹备这个“AI游戏锦标赛”,背后的程序员和开发者们相当于是“教练”或者“选手家长”,最终的获胜者可获得1400瑞士法郎(折合人民币9261元)。

07a23b5001ff927b097bd9ccfa62e626.png

“比赛项目”也不止是铁拳一种,开发者表示,这些格斗游戏的底层机制都比较类似,只需要修改一下组合技、人物血条数值等游戏的差异性属性。

所以,他们的DIAMBRA Arena框架面向各类街机视频游戏提供完全符合OpenAI Gym标准的Python API。

像死或生、街头霸王等多个流行的街机游戏都被囊括其中:

c2e560f039e4249b731a47883d0e7948.png

GitHub链接:

https://github.com/diambra/diambraArena

视频链接:
https://www.youtube.com/watch?v=9HAKEjhIfJY

参考链接:
[1]https://www.reddit.com/r/reinforcementlearning/comments/sq1s3f/deep_reinforcement_learning_algorithm_completing/
[2]https://www.reddit.com/r/MachineLearning/comments/sqra1n/p_deep_reinforcement_learning_algorithm/


http://www.ppmy.cn/news/590939.html

相关文章

绝地求生服务器维护3月25日,绝地求生:3月25日停机维护五小时修复BUG,三周年在线57W...

今天绝地求生3月25日早上8:30开始停服修复游戏中出现的一些BUG,官方发出公告大概需要5小时就能更新完毕,而且近期也是绝地求生三周年的生日,在线人数也是达到了57W,也是可喜可贺啊。 因为近期的在线人数一直只有10W左右…

黑客反击战3

回到宿舍后我照例打开机子,收到了肥猫的留言。他告诉我美国黑客组织PoisonBOx的行动升级了,已经开始大肆攻击中国网站,并由政府网站扩散到民间网站。他知道我在一家大公司上班,因此警告我要小心防范。他当然不知道我的公司已经被攻…

Python分析《羞羞的铁拳》电影观众评论

專 欄 ❈ 伟楠,Python中文社区专栏作者,数据分析师,知乎专栏:数据故事会。 https://www.zhihu.com/people/hao-wei-nan ❈ 前段时间上映的《羞羞的铁拳》可谓是票房大丰收啊,截止到我写这篇文章时,我看了眼…

铁拳nat映射_铁拳如何重塑我的数据可视化设计流程

铁拳nat映射 It’s been a full year since I’ve become an independent data visualization designer. When I first started, projects that came to me didn’t relate to my interests or skills. Over the past eight months, it’s become very clear to me that when c…

RTX 4060跑分出炉,加量还降价真良心了?

RTX 40 系真正意义上主流平民级显卡 4060 桌面版已确认于本月 29 日推出。 相较于原定的 7 月中旬上市提前了半个月左右,国内售价 2399 元(比 RTX 3060 首发低 100 元)。 从这样的「早产」操作能看出,RTX 40 系显卡拉胯销量表现确…

崩坏3服务器维护2月8号,崩坏3 3.9版本「逐暗星辉」更新维护通知

亲爱的舰长: 为了给舰长更好的游戏体验,休伯利安号将在4月16日进行版本更新维护,维护完成后战舰将更新为3.9版本——「逐暗星辉」。 维护时间 4月16日05:00~12:00 维护时间可能会根据实际情况有所调整,请舰长以实际能够进入游戏的…

[JZOJ5591]. 修修的铁拳

题目描述 给出初始点(x0,y0),你可以走T步,每次上下左右,最终你会走到一个点(x,y),这个点的贡献是 xnym x n y m ,问所有方案的贡献和。 解题思路 考虑40分怎么做,可以枚举一个(x,y),算出到…

用OpenCV玩《铁拳》!!!

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达用手势导航可以完成GTAV,那么这一思想也能带入到别的游戏中。因此,我们的第一选择是打格斗游戏,并且该类别中最好的游戏之一是《铁拳》…