对话ChatGPT:Prompt是普通人“魔法”吗?

news/2024/11/29 4:01:08/

        在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下,不少人或多或少听说过Prompt的概念。

        虽然OpenAI掀起的大模型浪潮再度刷新了人们对AI的认知,但现阶段的AI终归还不是强人工智能,大模型里的“知识”存储在一个隐性空间里,需要输给AI正确的指令,也就是过去几个月中频频被讨论的Prompt。

        有人将Prompt翻译成“提示词”,也有人翻译为“激发词”。再感性一些,就像童话故事里的魔法一样,Prompt是AI时代的魔法,拥有它就拥有“巫师”一样的能力。


01 | Prompt是什么?

        并不难理解Prompt的字面含义,可为何会出现Prompt这个概念?既然是ChatGPT炒热的新名词,不妨让ChatGPT自己来回答。

        这个回答中规中矩,但还是可以提取到一些有价值的信息:一,Prompt继承了计算机编程里的命令行提示符,可以理解为控制AI的指令;二,在生成式AI的语境里,Prompt的价值在于引导,而非计算机里的命令。

        打个比方的话:大模型就像是人类的大脑,知识被存储在神经元联接中,只有当你遇到具体的问题时,就像“你最喜欢的食物是什么?”大脑才会给出确切的答案,Prompt等于是一个个具象的问题。由此产生了一种流行的说法,即提问比回答更重要。你使用ChatGPT所遇到的“边界”,实际上是你自己的“边界”。

        但Prompt的价值体现,并不在于ChatGPT代表的对话机器人,而是Midjourney为首的图像生成类应用。

        简单来说,你要告诉AI想要什么样的图,想要把自己脑海里的东西变成肉眼可见的图案,需要几十个单词作为Prompt。哪怕只有一个提示词的差异,AI所生成的图像都可能有着质的差别,怎么正确地给AI投喂Prompt,逐渐成了一门深奥的学问,并衍生出了提示语工程学(Prompt Engineering)的说法。

        以至于在衡量大模型的能力时,出现了三个标准:一是大模型的预训练水平;二是用来进行预训练语料数量和质量;三是提示语的水平。直接的例子就是外界对文心一言文生图的质疑,即使不考虑前两个因素,单单在提示词方面,就足以让文心一言和Midjourney拉开几条街的距离。

        因为在文心一言上想要生成图片,普遍给的指令是:帮我生成一张XXX(这也是百度官方的示例),解析为Prompt时注定只有几个提示词,远不足以表达脑海里想要的画面;同样的需求给Midjourney,可能是十几个乃至几十个提示词,大模型可以更准确地理解并输出用户想要图案。

        理解了这些差异,便不难读懂Prompt走红的原因。

        目前大模型对算力的要求很高,以OpenAI的DALL?E为例,生成一张图片的收费约0.02美元,如果让不懂Prompt的人去调用模型,大概率会浪费掉一次次算力。何况当前想要生成满意的图片,需要不断重复调整,能否熟练运用Prompt,直接左右了大模型所能释放的生产力。


02 | Prompt 还能赚钱?

        利用信息差赚钱向来是最容易做的生意,生成式AI也不例外,Prompt作为AI时代的魔法,已然成了不少人用来“赚钱”的生产资料。

第一种:直接售卖Prompt。

        国外已经出现了PromptBase等明码标价的平台,涉及Midjourney、Stable Diffusion、DALL?E、GPT等多个模型,而且适用的场景越来越细分,包括音乐创作、儿童插画、油画艺术、人物肖像等等,即便是不擅长整理提示词的普通用户,也可以直接复制Prompt生成相对不错的作品。

        其实国内也有类似的现象,一些商家早已在电商平台上兜售Prompt,也有一些人将Prompt做成面向垂直任务场景的应用,比如AI 写评语、AI写邮件、AI翻译等等,吸引刚需用户按月付费使用。

第二种:用Prompt换流量。

        国内最早一批售卖AI课程的自媒体,多半将Prompt作为吸引用户付费的筹码;小红书等年轻人扎堆的平台上,早早出现了分享Prompt的笔记;B站、抖音等视频平台上,教用户使用Prompt的教程已不可计数。

        个中逻辑并不复杂。Prompt是驾驭AI的“咒语”,但提示词本身并没有版权效应,或许直接兜售Prompt可以快速变现,终归是不长久的买卖。将Prompt作为涨粉工具,趁机吸引到可观的粉丝群体,在流量变相高度繁荣的互联网江湖,无疑更符合市场规律,也是Prompt被广泛讨论的另一重诱因。

第三种:靠Prompt“找工作”

        正如前面所提到的,正确使用Prompt已经是提升生产力的前提,不单单产生了提示语工程,还酝酿出了一批“提示词工程师”(Prompt Engineer)。

        国外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速涨粉,然后被硅谷独角兽Scale AI聘请为“提示词工程师”,据说年薪高达百万人民币;另一位名为Jason M. Allen的艺术家,则使用Midjourney赢得了Colorado State Fair周年艺术比赛……如果说计算机时代的能力密码是编程,在生成式AI席卷全球的当下,Prompt正悄悄成为数以万计打工人“傍身”的工具。

        至少就目前来看,程序员群体里已经渐渐兴起两股风潮:一类人瞄准了OpenAI等大模型企业的API,想要坐在人工智能的副驾驶上创业;另一类人打起了创造Prompt的主意,想要利用信息差赚到第一桶金。

        倘若ChatGPT的出现当真是所谓的iPhone时刻,围绕Prompt的生意其实才刚刚开场。


03 | Prompt 只是过渡?

        相对应的一个问题是,Prompt是否是人工智能大众化不可或缺的一环?这个问题的答案直接影响着Prompt和Prompt Engineer的红利周期。

        Open AI 的 CEO Sam Altman曾公开表示:五年后,就不再需要 Prompt Engineering。也许在接下来的一段时间里,我们仍需要提示语,需要去创造 Prompt,但生成式AI的发展速度可能超乎想象,AI对人类的理解力远未触达天花板。

        可以佐证的是,第一代iPhone上市时还没有App Store,仅预装了浏览器、iPod、邮件等少量应用,想要安装其他应用,需要在电脑上安装iTunes,用USB线将iPhone连接到电脑……为了解决用户体验上的局限性,越狱工具和第三方应用商店应运而生,但在苹果引入App Store后,越狱工具渐渐被丢进了历史的故纸堆。

        同样的问题询问ChatGPT,答案似乎客观了许多。

想要不用特定Prompt就能和AI流畅对话,ChatGPT认为需要解决四个挑战:

  • AI需要更好地理解语境和连贯性,哪怕用户像《大话西游》里的唐僧一样喋喋不休,或者语无伦次,AI也可以准确理解用户的意图,这样就不需要精确的提示词,用自然语言进行提问。
  • AI需要有丰富的常识和推理能力,即根据特定的信息和场景做出合理的回应,而非像现在的模型那样“对牛弹琴”,比如中文里的多义词、不同场景下不同含义的语气词,非常考验推理能力。
  • AI需要理解和处理情感信息,这也是当前AI研究的重心所在。人的情感可以有很多种表达方式,文字只是其中重要的一种。在大模型不断向多模态演进时,视觉和声音是否也可以传递信息?
  • AI需要有主动学习和适应能力。主动学习是指AI系统在学习过程中,能够主动选择最具信息量的样本进行学习,在数据稀缺的情况下做出更好的决策;适应能力是指AI在面临新的任务、场景或环境变化时,能够自我调整并优化其行为。

        按照ChatGPT的标准,在Prompt消失的时候,势必已经进入到了强人工智能时代,目前还有很长一段距离。

        Prompt及其衍生机会的消亡是一种历史必然,在时间上仍有很大的不确定性,也许会很快出现另一场技术爆炸;也许AI会进入新一轮的瓶颈期, Sam Altman的五年预期不过是“盲目乐观”。

04 | 写在最后

        或许可以借用科技媒体《VentureBeat》的说法:现在已经到了AI艺术的转折点,未来的艺术家无论是自学成才还是科班出身,都需要有创造Prompt的能力,需要理解和学习数据科学,以及大模型的工作原理。

        进一步延伸的话,需要有这些能力的绝不只是艺术家,任何职业、任何行业的工作都不可避免和AI协作,将人类的思考和需求注入给AI,不断更新、创造Prompt,将是大多数人必须要掌握的一种技能,就像现在必须要用输入法打字一样。


http://www.ppmy.cn/news/46265.html

相关文章

基于互相关性的信号同步

许多测量涉及多个传感器异步采集的数据。如果您要集成信号并以关联式研究它们,您必须同步它们。为此,请使用 xcorr。 例如,假设有一辆汽车经过一座桥。它产生的振动由位于不同位置的三个相同传感器进行测量。信号有不同到达时间。 将三个时…

Java集合底层原理

目录 ArrayList集合源码创建ArrayList集合扩容机制 LinkedList集合源码添加数据 迭代器源码HashSet底层原理HashMap源码创建HashMap对象添加元素 TreeMap源码基本属性与构造器添加元素 以下源码来自JDK11 ArrayList集合源码 创建ArrayList集合 /* 无参构造,返回一个空数组 参…

DPDK系列之十三虚拟化virtio源码分析之应用层

一、应用 其实不管怎么设计,如何开发,结果都是要展现一个结果,能够为人所用。虽然说virtio的应用场景有不少,但是在DPDK中主要就是网卡。所以,在此处主要是对网卡的抽象的实现,即对上层的应用实现底层的vi…

【ChatGPT】基于tensorflow2实现transformer(GPT-3.5)

请记住,您是一位NLP领域的专家和优秀的算法工程师。使用带有 tensorflow2.0 subclass api 的 python 从头开始实现 transformer 模型。 全部内容如下: 构建transformer模型架构和依赖层;生成并预处理一些假样本数据,用于训练上面…

NOIP模拟赛 T3区间

题目大意 有 n n n个数字,第 i i i个数字为 a i a_i ai​。有 m m m次询问,每次给出 k i k_i ki​个区间,每个区间表示第 l i , j l_{i,j} li,j​到第 r i , j r_{i,j} ri,j​个数字,求这些区间中一共出现了多少种不同的数字。部…

用Abp实现找回密码和密码强制过期策略

文章目录 重置密码找回密码发送验证码校验验证码发送重置密码链接创建接口 密码强制过期策略改写接口 Vue网页端开发重置密码页面忘记密码控件密码过期提示 项目地址 用户找回密码,确切地说是 重置密码,为了保证用户账号安全,原始密码将不再…

【通过Cpython3.9源码看看列表到底是咋回事】

列表结构 typedef struct {PyObject_VAR_HEAD/* Vector of pointers to list elements. list[0] is ob_item[0], etc. */PyObject **ob_item;/* ob_item contains space for allocated elements. The number* currently in use is ob_size.* Invariants:* 0 < ob_siz…

ObjectARX中的坐标系以及坐标转换

1 AutoCAD中的坐标系种类 WCS World Coordinate System. The “reference” coordinate system. All other coordinate systems are defined relative to the WCS, which never changes. Values measured relative to the WCS are stable across changes to other coordinate s…