仅用自然语言,让ChatGPT输出连贯的长篇小说!苏黎世联邦理工大学提出RecurrentGPT

news/2024/12/29 8:10:13/
夕小瑶科技说 原创
作者 | ZenMoore,Wangchunshu Zhou

前言

ChatGPT 是万能的吗?

显然不是,至少在今天我们所讨论的长文本生成上,ChatGPT 可以说是几乎完全不太可能生成长篇小说。

在某种程度上,这是 Transformer 模型的固有局限,因为 Transformer 核心组件 self-attention 的 O ( N 2 ) O(N^2) O(N2) 复杂度注定让它不能处理太长的输入,也因此不太适合产生太长的输出。

为了解决这个问题,很多研究试图将 RNN 的那种循环机制引入到 Transformer 里面,比如著名的Transformer-XL, Block-Recurrent Transformer.

然而,这些方法存在一个很关键的、又很现实的问题:需要修改模型架构,不兼容 ChatGPT 等闭源大模型,因为 ChatGPT 的模型参数、结构是不会公开给使用者的,我们能做的,仅仅是喂给它一些 Prompt.

正是因为这些大模型的闭源属性,导致我们在使用它们的时候,不得不以一整个模型作为最小单位,而无法进一步拆解模型内部的模块,将其修改以适配长文本生成的需要。

那么,在这种情况下,我们还怎么把循环机制引入到闭源大模型当中去呢?

今天讨论的这篇文章实现了一个绝妙的想法:仅用自然语言 Prompt,我们就可以模拟 LSTM 机制,而完全不需要修改 ChatGPT 的内部结构!

论文地址:
https://arxiv.org/abs/2305.13304

论文机构:
苏黎世联邦理工大学

项目地址:
https://github.com/aiwaves-cn/RecurrentGPT

在线Demo一:
https://www.aiwaves.org/recurrentgpt (长篇小说写作)

在线Demo二:
https://www.aiwaves.org/interactivefiction (交互式小说)

大模型研究测试传送门

ChatGPT能力研究传送门:
http://hujiaoai.cn

GPT-4能力研究传送门(遇浏览器警告点高级/继续访问即可):
https://gpt4test.com

基本原理

RecurrentGPT 的整体架构基于模型与其自身进行的交互(可参考文献 Interactive Natural Language Processing )。

如上图所示,在每个时间步上,ChatGPT 会接受四个部分的输入:

  1. 上一个时刻的输出: o t o_t ot
  2. 梗概(Plan): x t x_t xt
  3. 短期记忆(Short-Term Memory): h t h_t ht
  4. 长期记忆(Long-Term Memory): c t c_t ct

ChatGPT 在生成内容的时候,会执行三种类型的操作:

  1. 更新梗概:生成下一步的内容梗概,这个生成的梗概可能有多种备选参考,可以使用一个额外的“用户模拟器”对这些参考进行筛选,选出最合适的那个梗概;
  2. 更新短期记忆:记录最近生成的内容的摘要;
  3. 更新长期记忆:保存历史生成内容中与当前时间步最相关的内容

具体的例子如下图所示:

在具体实现上,作者采用了如下图所示的 Prompt:

RecurrentGPT 使用的具体 Prompt

作者们利用这个 Prompt 指示语言模型在更新短期记忆的时候,不仅新增最新生成内容中的有用部分,还要删除掉与之后内容生成无关的过往记忆。除此之外,作者在 Prompting 的过程中,也着重强调了小说写作场景的重现,以使 ChatGPT 生成的内容更具备像小说那样的细节,防止其快速地完成情节的叙述。

实验结果

作者们使用了人工逐对评测的方式:

在多种多样的小说风格、类型等方面,人类读者普遍认为 RecurrentGPT 的表现更具趣味性和连贯性。

实际效果

用法一:内容创作者输入场景设定和需求,RecurrentGPT 就可以自动产生长文本,而不需要人类过多的干预。

用法二:在生成梗概的时候,用户也可以对梗概进行选择或者编辑等操作,以控制长文本的生成过程。

用法三:类似于互动视频那样,RecurrentGPT 不仅可以服务于内容创作者,还能直接给内容消费者提供新的体验,作者称之为 “AI as Content”(“AI即内容”)。内容消费者不仅可以读小说,还能与小说直接进行互动,跳过内容创作者使用AI进行内容创作的步骤。

总结

本文介绍了一种名为 RecurrentGPT 的方法,通过使用自然语言的 Prompt,模拟了 LSTM 的循环机制,从而在闭源大模型(如 ChatGPT)中实现了长文本生成的能力,而无需修改模型的内部结构。RecurrentGPT 的整体架构基于模型与其自身的交互,通过更新梗概、短期记忆和长期记忆来生成内容。作者通过人工评测和实验结果展示了 RecurrentGPT 在多样的小说风格和类型方面的表现优势。实际应用中,RecurrentGPT 可用于自动产生长文本、让内容创作者选择或编辑梗概以控制生成过程,并可以为内容消费者直接提供互动式体验,将 AI 作为内容呈现给消费者。


http://www.ppmy.cn/news/138641.html

相关文章

hp 磁带机安装配置

hp 磁带机安装配置 公司用的是tape array 530磁带机 磁带机驱动器是DAT40。HP DAT 40磁带驱动器大小20G。压缩后是40G。 注意磁带库比磁带机容量更大,容量上P,管理更智能。里面有机械手,磁带库 磁带机 机械手 磁带比磁盘具有体积小巧、容量…

HP的“高端”磁带库!

单位有两台HP的MSL6060,这种机器在西北地区好像都不是很多,省内就我们一家有,属于高端设备,但是HP的这种垃圾设备竟然这么不耐用! 开始是机械臂坏了,800保修给我送来一个不匹配的机械臂,耽误整整…

通过python采集1688app商品详情数据,1688app商品详情数据接口,1688API接口

要通过Python采集1688app商品详情数据,你可以使用以下步骤: 安装必要的 Python 模块:requests, BeautifulSoup4 和 lxml。使用 requests 模块发送 HTTP 请求获取网站 HTML 内容。使用 BeautifulSoup4 模块解析 HTML 页面并提取所需的数据。编…

Inner Join 的使用和多条 Inner Join 的使用顺序要求

一、关于 MySQL 中 Inner Join 的使用 1.1 Inner Join 简介 Inner Join(内连接)是 SQL 中最常用的连接类型之一,它用于根据两个或多个表之间的共同字段将表组合在一起。Inner Join 返回符合指定条件的记录组合,并且只返回与多个…

绘画

绘画艺术 艺术鉴赏讨论 多种画作

《画》

很喜欢这个回答,置顶。 https://www.zhihu.com/question/22664617/answer/41761932 为寂寞的夜空画上一个月亮 把我画在那月亮下面歌唱 为冷清的房子画上一扇大窗 再画上一张床 画一个姑娘陪着我 再画个花边的被窝 画上灶炉与柴火 我们一起生来一起活 画一群鸟儿围着…

有趣的Drawings,动起来的画

发现了一个有趣的网站,可以让手绘的人物动起来 地址:Drawings 操作也特简单,只需要将画导入,就可以看到效果。 不需要画的很好,它也可以识别 好了,让我们动手试试吧 1、首先画个小人儿 2、然后导入&…

会画

**会画(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookies与Session。Cookies通过在客户端记录信息确定用户信息,Session通过在服务器端记录信息确定用户信息。 Cookie 在程序中&#xff…