这只拒绝内卷的 AI 狼火了!高智商却自暴自弃,不想抓羊只想躺

news/2024/10/22 23:50:07/

上一篇:深夜看了张一鸣的微博,让我越想越后怕


  新智元报道  

来源:B站等 编辑:Yaxin

【导读】近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」!

智障AI狼最近火了!

 

在一个狼吃羊的AI游戏中,狼发现自己吃不到羊,而选择了「自杀」。

 

 

那么,狼为啥会选择直接撞死呢?

 

傻狼选择「自杀」,只因人间不值得!

 

近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。

 

 

在他发布的这三张聊天记录截屏中,具体介绍了这个狼抓羊的游戏机制。

 

从截图中可以看出,狼选择撞石的原因竟是,「自杀分数高!」

 

在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。

 

开局两只狼,还有六只羊,地图上红色带×的字符就是狼和羊随机出现的可能位置。

 

 

狼和羊前面有6根射线,是用来感知范围。当这6根线和障碍物以及地图边界碰撞,就会返回一个坐标。

 

那根坐标白线便是狼和离它最近羊的连接,这样狼就可以每次优先吃掉最近的那只羊。

 

在研究人员开始训练的最初阶段,先固定了羊的位置,让狼去学习抓羊。

 

在狼学会抓羊后,羊也以随机的位置出现在游戏中。

 

狼抓到羊,奖励10分

 

狼撞到障碍物,扣1分

 

为了节省狼抓羊的时间,每秒钟狼都会受到0.1的惩罚

 

其中,羊撞到石头不会死,只要存活时间长,羊就能得到高分。

 

 

如果这两只狼想要在20秒以内得到高分,需要狼吃到羊的数量越多越好,吃羊所用时间越短越好。

 

在研究人员进行了20W次的训练,竟发现狼抓羊的效果越来越差。

 

大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!

 

该项目的一位研究人员@Sdust星尘研表示,「之所以会自杀, 是因为狼在前几万次的训练中发现一头撞死只扣-1.1分(-1 + -0.1)。

 

往羊那边走两步撞死扣-1.1到-2.4分。

 

偶尔一次能吃到,虽然正分,但是不值得」。

 

 

狼是打工人,羊是永远达不到的升职加薪

 

这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。

 

网友们从狼抓羊的身上看到了自己。

 

那只狼不就是现在的我么!

 

 

狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…

 

 

还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」。

 

 

奖励机制不合理

 

有网友对这一项目的奖励机制设置是否合理提出了质疑。

 

 

还有网友认为,单步惩罚太大,而撞障碍物的惩罚太小,应该把奖励函数设置为,撞到障碍物的惩罚无穷大,那么狼就知道了撞石的代价,就不会轻易选择自杀了。

 

 

所以,狼选择自杀的部分原因也是奖励机制设置不合理而导致的。

 

星尘研在B站中的视频表示,狼自杀的错误是很多因素共同影响产生的,最主要的原因是迭代次数太少,20W次完全不够学。后面提高到100W次起步,效果直线上升。

 

 

自暴自弃的狼终于抓到了羊

 

训练次数从最初5W次一轮,迭代了13代。到后来改成200W一轮,迭代了5代,狼抓羊的训练效果明显提升。

 

 

在训练了300万次后,狼终于可以成功地吃到羊。

 

 

但是,游戏还是存在一定的缺陷,两只狼还是会偶尔撞石而死。

 

 

狼终于学会了抓羊~~

 

 

参考资料:

https://m.weibo.cn/6611961566/4613651452134398 https://m.weibo.cn/6611961566/4613930355525879

https://www.bilibili.com/video/BV16X4y1V7Yu?p=1

                              · END ·

最后,关注公众号互联网架构师,在后台回复:2T,可以获取我整理的 Java 系列面试题和答案,非常齐全。

正文结束

推荐阅读 ↓↓↓

1.不认命,从10年流水线工人,到谷歌上班的程序媛,一位湖南妹子的励志故事

2.如何才能成为优秀的架构师?

3.从零开始搭建创业公司后台技术栈

4.程序员一般可以从什么平台接私活?

5.37岁程序员被裁,120天没找到工作,无奈去小公司,结果懵了...

6.IntelliJ IDEA 2019.3 首个最新访问版本发布,新特性抢先看

7.漫画:程序员相亲图鉴,笑屎我了~

8.15张图看懂瞎忙和高效的区别!

一个人学习、工作很迷茫?

点击「阅读原文」加入我们的小圈子!


http://www.ppmy.cn/news/283407.html

相关文章

linux清理db2表空间,快速清空DB2表记录

truncate 命令在DB2里面没有,V9.7据说有. db2 import from /dev/null of del replace into tabname 在DB2数据库中,如果想快速清空一张大表(类似在 ORACLE 中使用 TRUNCATE TABLE 快速清空一张大表),有两种方法: 1. 使用 “ ALTER TABLE 表…

Docker私有仓库部署和管理

Docker--harbor私有仓库部署与管理 ------------------------------------ Harbor 简介 ------------------------------------ (1)什么是Harbor Harbor 是 VMware 公司开源的企业级 Docker Registry 项目,其目标是帮助用户迅速搭建一个企业…

【django】ModelForm组件调用save()方法不更新只新建记录的大坑

问题出现 用了ModelForm组件,想用save方法直接更新数据库记录。但是死活都不是更新,而是新建一条记录,不报错,而且也传了instance参数,网络答案大多是说instance参数没有传。但我并不是这个原因。 modelform部分设置如…

美团实习记录

记录在美团实习遇到的问题以及自己的思考和解决方案等。 MAC使用起来是真的舒服啊。 monaco 字体看起来是真的舒服啊。 封装,封装,封装。 解耦,解耦,解耦。 这是楼主在美团实习最大的感触。 你可以从技术层面(面向对象…

灰狼优化算法(GWO)(解决TSP问题,代码完整免费)

算法背景 灰狼优化算法(GWO),由澳大利亚格里菲斯大学学者 Mirjalili 等人于2014年提出来的一种群智能优化算法。灵感来自于灰狼群体捕食行为。 优点:较强的收敛性能,结构简单、需要调节的参数少,容易实现,存在能够自…

Java程序练习-狼找兔子

题目 一只小兔子躲进了10个环形分布的洞中的一个。狼再第一个洞中没有找到兔子,就隔一个洞,到第三个洞去找;也没有找到,就隔两个洞,到第六个洞去找;以后每次多一个洞去找小兔子…这样下去,如果…

JS笔记(前端小灰狼)

目录 JavaScript基础语法 序言 JavaScript发展历史(JS) JavaScript能干什么 JavaScript的组成 JavaScript代码的书写位置 行内式 JS 代码(不推荐) 内嵌式 JS 代码 外链式 JS 代码(推荐) JS 中的注…

Leader,要做一只领头“狼“,不要做一只领头“羊“

技术开发人员做到一定年限,势必要往上走。无论作为项目小组长,还是项目经理,亦或部门经理。都会管理几个到几十个或多或少的人员。 技术人员做管理,有的似乎天生丽质适合做领导,有的似乎天生不适合做领导。 那么&…