给AI挖坑 | 实测New Bing能否回答员工那些刁钻的问题?

news/2024/10/18 16:46:03/

ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源


之前玩ChatGPT,发现这玩意很擅长胡说八道,比如你让它写一段发言稿,并引用鲁迅名言,于是它写下了这样一句:

在这里,我想引用鲁迅先生的名言:“立足于现在,放眼未来”

这自信地瞎掰,堪比中学时我们在作文中写下”西方有一位哲人曾经说过“。

ChatGPT不联网,它的答案是编的,而不是搜的,这其实使它不太适合作为一个问询机器人,特别是回答企业内部的一些问询。

而New Bing,是联网的!

它会用它的理解能力理解问题,去搜索,再重新组织语言。

联网的GPT能有多强?会不会掉入陷阱?

我设计了三个员工问询的场景,来做演示和验证:

  1. 休假政策问询

  2. 加班费计算问询

  3. 辞退相关法律咨询

从结果来看,现在的AI并不止善于组织语言,对文字的“理解能力”也是很超乎想象的!(AI并不一定是真正的理解了,但能给出我们喜欢的答案,让我们相信它懂得起)

场景1:育儿假政策咨询

√ 正确判断是要找育儿假的政策

√ 正确判断应该找工作地,而非户籍地的政策

× 故意选了超龄的情况,它掉坑里,并认为我的条件符合政策

√ 我反问它,它重新拿我给的条件和政策做了比较,发现并承认了之前的错误。

√ 它理解双胞胎是2个人

√ 它理解了我是想问能不能叠加

√ 对比了搜索结果和我给的条件,告诉了我答案

√ 它记得我前面说过上海户口

√ 它理解到了上海户口就是户籍所在地为上海

√ 它理解回上海工作,要搜上海的政策

√ 它理解“扣钱”说的是扣工资

× 这个回答还是很官方,并没有直接告诉我答案

场景2:加班费的计算

√ 它理解深圳相应的是中国的法规

× 今年的4月30日是休息日,不应按平日加班计算

× 第二天是五一,有可能要按节假日加班算,它没考虑到

√ 能够将搜到的文字转化为数学公式

√ 能够理解公式中的参数,能把值带入参数计算

× 我说过加班时间,不过确实说得比较隐晦,它没理解

√ 能够根据对时间的文字描述计算出时长

× 照着公式算错了

× 咋还就算不对了呢

√ 了解了节假日加班费不同!

√ 知道五一是节假日,有两下子

√ 这次算对了

场景3:劳动法规相关咨询

√ 明白了我是想问迟到扣工资是否合法

× 一、二句是矛盾的

× 没有考虑低于最低工资的问题

× 没理解我其实是想问,这是依据的什么法条

√ 多解释了一下,它懂了

√ 它懂“法条”是什么意思

√ 它搜对了

√ 它理解“到手”是在说工资

√ 联系前文,它知道我在说最低工资标准

?给了一个谨慎的结论(你们觉得这样回答回更好吗?)

√ 我只能说,有点东西!

√ 知道要用4年来算(这是什么原理?)

√ 理解了这个问题实际是在问前文中的违法解除

需要说明的是,由于每次问答GPT都要重新组织语言,因此会有同一个问题给出的回答不一致的情况。在测试中,还有更多回答错误、不妥的情况,没有贴出来。

如果作为企业内部的员工问询机器人,对于政策、法规相关的问题,其实是不容有失的,GPT也许暂时还不完全适用。

GPT有多强?能干什么?希望能帮助大家有些更直观、更深入工作场景的认识和感受。


ChatGPT狂飙160天,世界已经不是之前的样子。

新建了人工智能中文站https://ai.weoknow.com
每天给大家更新可用的国内可用chatGPT资源


http://www.ppmy.cn/news/970268.html

相关文章

如何用Rosetta全家桶设计一个抗体?

新冠肆虐无药可医, 医护冒险奋战在前线。 实验室里抗体设计, 试管里混合液波光粼粼, 分子结构、细胞实验频频。 日以继夜,孜孜不倦, 只为破解疫情的难题。 我们紧密团结,努力前行, 心中不灭的信…

软件架构介绍

一、定义 软件架构:可以简单理解为满足干系人关键诉求的一系列宏观决策。 二、软件质量属性 软件架构师大部分时间在解决以下产品质量模型中的质量属性问题。 三、程序员和架构师区别 从思维逻辑方面来看, 程序员从功能和业务逻辑方面去想问题。 架…

vue el-dialog缓存问题

Vue 在重新打开Dialog 时,经常回保留之前遗留的数据,此时用v-if 或者 destroy-on-close 都没有用的,正确的处理办法如下: 在关闭dialog 的时候调用 1 2 3 onClosed() { Object.assign(this.$data, this.$options.data()) …

图解java.util.concurrent并发包源码系列,原子类、CAS、AtomicLong、AtomicStampedReference一套带走

图解java.util.concurrent并发包源码系列,原子类、CAS、AtomicLong、AtomicStampedReference一套带走 原子类为什么要使用原子类CAS AtomicLong源码解析AtomicLong的问题ABA问题AtomicStampedReference 高并发情况下大量的CAS失败,导致CPU空转 往期文章&…

灵遁者诗歌集《禅在禅中》序言篇:写诗激情已去

导读:我当然不能和ChatGPT比写诗歌,我不再渴望写诗歌了,激情褪去了。但《禅在禅中》我会坚持写完。 本文为灵遁者诗歌集《禅在禅中》序言篇: 我今天做了一个奇怪又真实的梦,大概是这样的,梦见有个小伙要跟…

AI教父Hinton最新采访万字实录:ChatGPT和AI的过去现在与未来

杰弗里辛顿(Geoffrey Hinton)被公认是人工智能的教父,数十年前他就支持和推动了机器学习,随着像ChatGPT这样的聊天机器人引起广泛关注,CBS的主持人于2023年3月初在多伦多的Vector研究所采访了Hinton。 全长40分钟的采访…

内网与外网有什么区别

内网 内网指的就是在某一指定的区域内由多台计算机互联成的计算机组,比如家庭、单位、学校、公司等,是一个小范围的,它可以在空间几千米内实现互联网文件管理、软件、打印机等共享,局域网是封闭的,它可以是两台电脑组…

自己动手做chatgpt:解析gpt底层模型transformer的输入处理

前面我们完成了一些基本概念,如果你对深度学习的基本原理还不了解,你可以通过这里获得更多信息,由于深度学习的教程汗牛充栋,因此我在这里不会重复,而是集中精力到chatgpt模型原理的分析,实现和实践上。Cha…