ChatGPT 可以预测未来吗?

embedded/2024/9/25 4:27:11/
aidu_pl">

推荐 4月13日的一篇有趣的 paper,特来分享。

👉 当前的大型语言模型(LLMs)具有强大的数据合成和推理能力,但它们在直接预测尚未发生事件的准确性上常常受到限制。传统的预测方法依赖于直接询问模型关于未来的问题。

本研究采用了一种双重提示策略来评估ChatGPT-3.5和ChatGPT-4的未来事件预测准确性。研究团队利用了ChatGPT在实验时的一个限制:即训练数据只到2021年9月。因此,他们利用ChatGPT对2022年的事件进行预测,采用了直接预测和“未来叙事”两种策略。

本文的挑战

1️⃣ 挑战1:如何提高预测具体未来事件的准确性

解决方法: 研究中采用的“未来叙事”提示策略,让ChatGPT讲述设定在未来的虚构故事,这些故事中的角色经历了训练数据后的事件。例如,模型可能被提示创建一个故事,在这个故事中,一个角色描述了他们在2022年观看奥斯卡颁奖典礼的经历。这种方法通过利用模型的叙事构建能力来提高数据综合和推断,从而提高预测的准确性。

2️⃣ 挑战2:如何有效利用模型的叙事能力进行预测

解决方法: 在经济情境中,研究者们利用模型扮演像美联储主席杰罗姆·鲍威尔这样的公众人物来进行叙事预测。通过让ChatGPT-4“扮演”鲍威尔,预测例如通货膨胀率这类宏观经济变量,研究发现模型在这种设置下能更准确地预测未来经济趋势。这说明通过故事叙述可以更有效地利用模型的生成能力,进行更深入的数据分析和预测。

                                                  图:ChatGPT3.5 最佳男配角预测。

本文的一些有趣发现 👉

1️⃣ 未来叙事策略的有效性: 研究发现,与直接预测相比,使用未来叙事的提示策略显著提高了ChatGPT-4在预测未来事件(特别是奥斯卡奖项和经济趋势)的准确性。这表明,利用故事叙述的方式可以更好地激发模型的数据综合和推断能力。

2️⃣ 模型对公众意见敏感的场景表现出色: 特别在预测涉及公众意见的领域(如奥斯卡奖项)时,ChatGPT-4的叙事预测非常准确。这可能表明,在公众意见对结果有显著影响的情景中,大型语言模型可以展现出更好的性能。

3️⃣ 预测准确性的双重性: 在一些宏观经济现象的预测中,尽管叙事提示提高了预测的准确性,但在某些情况下,重要的信息分享可能导致估计结果出现反向偏差。这说明在使用这些模型进行预测时,信息的处理和整合方式极其重要。

总而言之,本文通过展示未来叙事策略在提高大型语言模型预测准确性方面的潜力,鼓励读者重新思考我们如何设计和利用AI工具的方式。作者希望借此引发关于如何负责任地使用AI技术的更广泛讨论,尤其是在确保使用AI时能够保障人类福祉和权利方面。


http://www.ppmy.cn/embedded/10739.html

相关文章

【学习】RESTful API

什么是RESTful API RESTful API 是一种设计风格,用于构建网络应用程序的 API。它基于 REST(Representational State Transfer)原则,提供了一种简单、灵活、可伸缩的方式来构建 Web 服务。RESTful API 设计的关键原则包括&#xf…

Linux bash 与 命令行 查找进程的不同

#必须使用 GL2ServerConsole.dll 来过滤 #不能使用 GL2ServerConsole #在命令行模式下一样 #但是通过远程bash调用 后者会返回如下内容: root 25800 0.0 0.0 113280 1220 ? S 20:36 0:00 bash -c /root/Run_GL2ServerConsole.sh root 25801 0.0 0.0 113284 872 ? S 20:36 0:…

就业班 第三阶段(负载均衡) 2401--4.19 day3 nginx3

二、企业 keepalived 高可用项目实战 1、Keepalived VRRP 介绍 keepalived是什么keepalived是集群管理中保证集群高可用的一个服务软件,用来防止单点故障。 ​ keepalived工作原理keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundan…

Webfunny埋点系统如何统计留存率

Hello,大家好,有小伙伴想要咨询webfunny埋点系统次日留存率该如何统计,今天我们就来讲一讲吧。 首先,我们以次日留存率来作为示例讲解说明,3日,7日留存率也是同理的。 示例场景:用户第一天前来…

污水处理厂自动化系统解决方案

一、引言 随着污水处理水质要求日趋严格,污水处理工业日越来越复杂,管理水平是污水管理工作的一大障碍,城市建设对水处理工艺的提高,让升级污水处理自动化系统水处理迫在眉睫。水处理涵盖净水与污水处理两大板块。技术进步让水处…

如何高效的压缩GIF图片?一键搞定GIF动图压缩 就是这么简单

一,引言 压缩GIF动图是一个常见的需求,无论是在社交媒体上分享动态表情,还是在网页设计中添加动态元素,GIF动图都扮演着重要的角色。然而,过大的GIF文件大小可能会导致加载速度慢,影响用户体验。因此&…

存内计算对大语言模型推理的加速

本篇文章集中讨论了存内计算技术在加速大语言模型推理方面的潜力,从大语言模型的背景知识出发,探讨目前其面临的挑战,进而剖析两篇经典的文献以彰显存内计算有望解决目前大语言模型在推理加速方面存在的问题,最后围绕大语言模型与…

【笔记】下云的一小步尝试——内网穿透

云上的世界很精彩,可是越来越贵,系统也越来越臃肿;如果我只需要云提供网络接入,流量大的时候CDN和load balancer就够了,其他的业务只想在内部公开,那么就得将一些需要内部化的服务下云了。用自己的数据中心…