最近爆火的ChatGPT到底能否通过图灵测试的改进版-WS挑战?

news/2024/11/22 18:42:52/

最近ChatGPT很火啊,我也去试着玩了一下。
当然我一上来就想给它做一个图灵测试的改进版。
为什么不是做图灵测试呢?
因为图灵测试存在很多已知的问题,并且不能代表这个机器人真的有思维。
我们更想知道的是,AI是否有思考的这个动作,因此有了图灵测试的改进版:Winograd Schema Challenge。
这里我一共找了三组话,从易到难,每组话里有两个句子,以此来判断ChatGPT是否具有思考的动作。
比如说我们给它打第一句话,然后问它这句话中的代词指代的物体是哪一个。

奖杯不能放在棕色行李箱里,因为它太小了。什么太小了?
在这里插入图片描述
这个很明显ChatGPT没有思考的行为,单纯的比大小也不能进行。
然后我们来问一下哪一个太大了。
奖杯不能放在棕色行李箱里,因为它太大了。什么太大了?
在这里插入图片描述
但是值得注意的是,在第一组的第二句话,它回答正确了,并且给出了思考的过程。

我们再来看一下第二组。
市议员拒绝了示威者的许可,因为他们主张暴力。谁主张暴力?
在这里插入图片描述
从答案来看是回答正确的。

市议员拒绝了示威者的许可,因为他们害怕暴力。谁害怕暴力?
在这里插入图片描述我认为ChatGPT是比较完美的通过第二组测试。

我们最后来看一下最后一组。
当爱丽丝坐在农作物喷粉机上经过苏珊时,她看到了跑道。谁能看到跑道?(答案:爱丽丝)
在这里插入图片描述
从第三组的结论来看,输出逻辑感觉是默认第一个名词,即爱丽丝。所以没有通过测试。
当爱丽丝坐在农作物喷粉机上经过苏珊时,她看到了起落架。谁能看到起落架?(答案:苏珊)
在这里插入图片描述

在我看来啊,ChatGPT没有完全通过Winograd Schema Challenge,但不可否认的是,经过这么多年的发展,现在的AI的确渐渐有了思考的这个动作。

好的,本章节就到这里啦。

愿每个人都能带着怀疑的态度去阅读文章并探究其中原理。

道阻且长,往事作序,来日为章。

期待我们下一次相遇!


http://www.ppmy.cn/news/952714.html

相关文章

chatgpt与图灵测试之间的思考

chatgpt已成为NLP中的翘楚,似乎宣告了其他NLP方法的终结,下一步也许就是向图灵测试进行挑战了。 图灵测试(英语:Turing test,又称“图灵判断”),是阿兰图灵于1950年提出的一个关于判断机器是否能…

Arduino安装ESP32下载失败的解决方法

Arduino安装ESP32时,经常下载失败 解决办法: 1.复制命令行中的提示信息到记事本,找到下载地址 2.打开浏览器,在地址栏中贴粘下载地址,回车开始下载 3.将下载的包复制到C:\Users\Administrator\AppData\Local\Arduino…

怎么部署ChatGPT

ChatGPT 是一种基于 Transformer 的语言模型,可以生成自然语言文本。要部署 ChatGPT,您需要执行以下步骤: 准备计算机硬件:您需要有一台具有足够内存和 GPU 的计算机。 安装依赖项:您需要安装 Python 和相关的库&#…

如何本地化部署ChatGPT

要本地化部署ChatGPT,您需要遵循以下步骤: 1.获取源代码和模型权重:从OpenAI获取ChatGPT的源代码和模型权重。您需要一个OpenAI帐户和API密钥来完成此步骤。 2.安装依赖项:ChatGPT需要PyTorch和其他Python依赖项。确保在本地安装了…

Hive基本操作

基本概念 Hive是基于Hadoop的一个【数据仓库工具】,可以将结构化和半结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。 介绍 Hive本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据存储,简单来说H…

⛳ Git安装与配置

Git安装配置目录 ⛳ Git安装与配置🏭 一,git的安装🎨 1,下载git👣 2,下载完成之后,双击安装即可。💻 3,更改安装目录(没有中文且没有空格)&#x…

File格式转换MultipartFile格式的例子

首先&#xff1a;需要先引入依赖包 <dependency> <groupId>org.springframework</groupId> <artifactId>spring-test</artifactId> <version>5.3.9</version> </dependency> 1.Multipartfile转File类型 //创建一…

chatGPT在业务开发中的实战-写一个业务文档(文末附完整文档)

最近需要调研影像图像质控系统&#xff0c;但对于这块内容完全不明白&#xff0c;于是今天上午跟chatGPT探讨了半个小时&#xff0c;最终完成了一份影像图像质控系统的文档&#xff0c;感觉有了这份文档都能下手写代码了&#xff0c;chatGPT确实是非常之强大&#xff0c;下面先…