一个关于宏定义的问题,我和ChatGPT、NewBing、Google Bard、文心一言 居然全军覆没?

news/2024/12/4 3:40:34/

文章目录

  • 一、问题重述
  • 二、AI 解题
    • 2.1 ChatGPT
    • 2.2 NewBing
    • 2.3 Google Bard
    • 2.4 文心一言
    • 2.5 小结

一、问题重述

今天在问答模块回答了一道问题,要睡觉的时候,又去看了一眼,发现回答错了。

问题描述:下面的z的值是多少。

#define FUN(a,b) a<b?a:bint x = 5, y = 8, z;
z = 4 + FUN(x, y);

我当时的回答是:z=4+5=9

但是编译运行的结果是:8

在这里插入图片描述

又看了一眼,恍然大悟,我曾经在文章中写过:宏的替换是简单的文本替换(请好好理解这句话),它在预处理阶段进行。当编译器遇到宏名称时,会将其替换为定义中指定的代码片段。宏替换是直接替换,没有类型检查或语法分析。

上面的代码经过预处理后是:

z = 4 + 5 < 8 ? 5:8 ;

现在,z=8应该没问题了。

二、AI 解题

突然好奇,这个问题,AI会不会做错呢,结果令我大吃一惊😲😲

2.1 ChatGPT

第一次问:
在这里插入图片描述

我说答案是8,他依旧坚持9,来来回回拉扯好几次:
在这里插入图片描述
n次拉扯后:
在这里插入图片描述

2.2 NewBing

只能说孺子可教:
在这里插入图片描述

2.3 Google Bard

情况跟ChatGPT差不多:

(1)
在这里插入图片描述

(2)

在这里插入图片描述

2.4 文心一言

这位更是重量级😅: 毕竟它自称擅长文本创作这方面。

在这里插入图片描述
其他国内模型就不展开了,差不多。

2.5 小结

(1)注意细节

我明明知道宏定义是文本替换,仍然反了错,实属不该。

(2)AI 并不完全可靠

从这个例子就可以看出,现在,AI 并不完全可靠(当然AI成长的很快)。如果我不知道宏定义的知识,当问了几个AI模型后,可能就会坚信那个错误答案。所以,对信息的甄别能力是很重要的。另外,也要提升自己的能力,才能在未来更好地使用AI工具。

为什么这些AI模型会犯错呢?

它们并不是万能的,本文的这个问题也不是什么复杂的难题,它们却全答错了,而且还要纠正半天。这应该与模型的训练数据有关,或许很少有人像上面那样写代码,或许很多人都犯这个错。对于保密程度很高的内容、前沿技术、特殊情况…AI或许不比人高明。

(3)AI模型版本

上面的问答中,NewBing的效果相对较好,轻轻一点就能修正错误。

  • ChatGPT iOS手机APP中使用的免费版本是:GPT-.5,Plus是4.0。
    在这里插入图片描述

  • ChatGPT网页版 :5.10号已经放弃使用GPT-3.5的Lagacy版本,现在使用的是default版本,应该是做了优化,Plus用户可以选择GPT4。
    在这里插入图片描述

  • NewBing手机版和网页版都是:GPT-4.0
    在这里插入图片描述

从上面的叙述可以发现,GPT-4貌似比GPT-3.5好上许多。

GPT-4 的提升:

可以在GPT-4的paper中看到与3.5的对比。
在这里插入图片描述

paper摘要:

这是一种大规模的多模态模型,可以接受图像和文本输入并产生文本输出。虽然在许多现实场景中的能力不如人类,但 GPT-4 在各种专业和学术基准测试中表现出人类水平的表现,包括通过模拟律师考试,得分在应试者的前 10% 左右。 GPT-4 是一种基于 Transformer 的预训练模型,用于预测文档中的下一个标记。培训后的对齐过程会提高真实性和遵守所需行为的措施的性能。该项目的核心组成部分是开发可在广泛范围内表现可预测的基础设施和优化方法。这使我们能够基于不超过 GPT-4 计算量的 1/1,000 的训练模型准确预测 GPT-4 性能的某些方面。

总结一下GPT3.5和GPT4.0的区别:

  1. GPT3和GPT4的最大不同之处在于规模,GPT3拥有175B参数,而GPT4拥有3.3T参数,可以有效地解决复杂语言任务。

  2. 另一个重要的不同之处在于GPT4使用了树型推理(Tree-Based Reasoning)来完成建模,这使得GPT4更加稳定、精确、高效。GPT4的模型可以有效地解决自然语言交互(NLU)和自然语言理解(NLU)等复杂NLP任务。

  3. 更创造性的写作能力,包括编歌曲、写剧本、学习用户写作风格

  4. 可以接受图片输入(暂不可用)、并生成字幕等

  5. 可以处理超过25000字长文本

  6. 智能程度大幅提升。以美国BAR律师执照统考为例:GPT3.5可以达到10%水平分,GPT4可以达到90%水平分。生物奥林匹克竞赛从GPT3.5的31%水平分,直接飙升到99%水平分,国际奥赛金奖水准。

真是一场历史性变革~



~


http://www.ppmy.cn/news/306997.html

相关文章

JSP+SQL网上书店销售系统(论文+系统)

本次毕业设计的题目就是网上书店系统。 本论文就毕业设计的内容,系统地阐述了整个网上书店系统的功能及实现。我们小组人员在指导老师的带领下设计并实现了从商品管理,商品分类和查询,到购物车实现,用户订单处理,再到聊天室,管理员系统。基本上实现了电子商务的功能流程…

15 笔记本电脑进入BIOS/EFI方式汇总

BIOS即基本输入输出系统【Basic Input Output System】&#xff0c;是个人电脑启动之时加载的第一个软件。人为可以设置BIOS&#xff0c;而设置BIOS中的虚拟化开关也是电脑装VMware等虚拟化软件的必要步骤。与BIOS类似的还有一个是EFI【可扩展固件接口 Extensible Firmware Int…

dell n5110 触摸板驱动

http://ftp.dell.com/input/R305170.exe 从这个地址下载安装文件&#xff0c;安装重启

华为存储OceanStor 5110V5 CA证书即将过期告警处理

故障现象&#xff1a; 华为存储OceanStor 5110V5&#xff0c;告警灯亮红色&#xff0c;如下图&#xff1a; 故障分析&#xff1a; 登录存储管理平台&#xff0c;发现有告警如下&#xff1a; 根据提示&#xff0c;很明显&#xff0c;CA证书即将过期&#xff0c;需要更新证书。…

戴尔N5110光驱SSD安装系统(HDD+SSD双系统)

新买了SSD准备装到笔记本光驱位并安装系统&#xff0c;但是不想损坏原硬盘(HDD)中系统和数据&#xff0c;记录一下安装过程&#xff1a; 因为默认总是从主硬盘引导系统&#xff0c;所以要保证主硬盘有系统或在主硬盘分一片区域用于引导系统&#xff0c;这里主硬盘已有系统。 …

三星GT-N5110不充电问题解决案例分享

三星GT-N5110不充电问题解决案例分享 一、故障描述&#xff1a; 之前发布的GT-N5110刷机升级后&#xff0c;那个平板就一直丢在角落没有碰过了。有个网友希望我帮忙看看他升级后功耗大的问题&#xff0c;我再次拿出来发现不知道什么时候屏幕一角碰到过&#xff0c;然后屏幕中…

STM32驱动_NOKIA5110

文章目录 english_6x8_pixel.hwrite_chinese_string_pixel.hnokia_5110.hnokia_5110.cmain.c english_6x8_pixel.h english_6x8_pixel.h如下&#xff1a; const unsigned char font6x8[][6] {{ 0x00, 0x00, 0x00, 0x00, 0x00, 0x00 }, // sp{ 0x00, 0x00, 0x00, 0x2f, 0x00, …

bzoj 5110 Yazid的新生舞会

题目大意&#xff1a; 一个数列&#xff0c;求有多少个区间$[l,r]$满足该区间的众数出现次数大于$\lceil \frac{r-l}{2} \rceil$ 思路&#xff1a; 对于一个区间满足条件的众数明显是唯一的 所以设该数的前缀和数组为$S$ 则一个区间$(l,r]$满足条件满足$2 \times (S_r-S_l)>…