从提示词到共振:李继刚的AI沟通法则

ops/2024/12/29 7:39:21/

摘要:在极客公园的演讲中,李继刚分享了他对提示词的深入研究,提出了通过场域和共振达到与AI深层次交流的策略。他分析了AI的存在属性,指出未来提示词将因AI进化而变得更为简洁和高效。

一、Prompt思考与总结

本文内容大多是源于李继刚在「极客公园」的分享。
2024 年 12 月 16 日,在极客公园 IF2025 创新大会上,Prompt布道师、读书人 李继刚分享了他写了两年提示词总结的最重要的法则——《当我们说 Prompt,我们到底在说什么?》在他的分享中,你可以领略到,如何穿透提示词的玄学属性,更好地和 AI 沟通。

大纲

此大纲由AI绘制而成,介意勿看
在这里插入图片描述

二、开场与问题提出

大家好,我是李继刚。今天我想给大家做一个分享。主题的确定让我思考了很长时间,最后我们讨论的结果,我觉得这个标题非常清晰:当我们在说提示词的时候,我们到底在说什么?

在平时跟大模型玩耍的时候,我发现了很多困惑:

  • 某些技巧可以产生更好的结果,但换了一个不同的场景,同样的技巧就会失效。
  • 跟它正常聊天,让它给我生成一段小说文本,它生成的内容是正确的,但带有AI的味道。它不是概率性输出,但它的输出结果和概率的平均值输出其实也没什么区别。
  • 有时候在某一次场景中,我跟它对话取得了非常好的结果。但因为各种原因,比如对话被删除了,或账号切换了,当我想要复现上一次的结果时,发现复现不了。结果跟上一次天差地别,但我的技巧、使用的方法都是一样的,为什么结果会不一样呢?

这些困惑让我开始思考:我的输入会影响它,但这意味着什么?这意味着这个事情是有研究空间的。我只要去琢磨那个思路,就能带来突破。只是中间的过程是怎样的?它是个黑盒,是个任谁都摸不透的东西,我要去琢磨它。

三、认知历程

我经历了几个阶段。第一个阶段,我发现它跟写作很像。当我把写作的一些技巧、方法论、框架带进去的时候,我发现它听懂了,它的输出结果明显比最开始时要变好。但写着写着,后来又发现这种过于宽泛、过于没有指定命题的写作会让人无所适从。

于是我又尝试着把编程的思维——结构化、抽象、函数,把这些技巧往里面带。然后发现效果也是生效的,它也变好了。这两者完全不是一个东西:一个是在旷野中奔跑,一个是约束好的路径让它去走。但是两者同时生效了,这让人更困惑了——它到底是什么?

然后我尝试着去综合这两者。这两者背后如果有一个东西能同时照顾到它们,那个东西是什么?后来我找到了:是表达。不管是编程还是写作,本质上都是在进行思考的表达。我有一个东西在脑子里,我要把它说出来。

  • 写作:一种非常宽泛的范畴。我在写内容,我在写文本,我通过文本表达我的思想。
  • 编程:我在约束它。我设置好路径:先向左拐,再向右拐,最后直行300米。
  • 表达:我是一个单向的输出,把我脑海中的思想射出去,命中它。

当我的定义不同,我的写法就会变:

  • 给定写作时,我用自然语言去写
  • 说在编程时,我会用编程的框架方法
  • 在表达时,我的注意力会放在我的大脑中,而不是放在文本上.

在这里插入图片描述

四、探索与发现

这些不同的定义带来了不同写法的变化。具体的文本其实不是那么关键,最根本的是那个定义——定义变了,写法就全变了。

所以我在过去两年尝试了大概三四种不同的写法。其实根本不是在文本上做工作,不是在做黑盒的测试,而是在脑海中尝试着回答那个最本源的问题。

但我会发现一个问题:这三个定义如果有一个词能把它们全部概括,那个东西是什么?回头去看,这三个东西其实都在做一件事:我有一个想法,我有一个观点,有一个方法论,我有一个东西想要表达出来。这里面全是"我",但是我在跟谁对话?对面是谁?

在写的过程中,在过去两年里,我的对面没有人。我在对虚空对话,我其实是在跟大模型做游戏。对面是A模型还是B模型,对我其实没有区别。这是不对的。

我刚才阐述的那三个定义是在做什么?我在为精神立法。一个定义就是一条法律,我不同的定义就活在不同的世界。我定完这个之后,但是对面没有东西,这个世界里只有我自己,这肯定是不对的。

五、AI的本质:一种特殊的存在

回头看你会发现一个非常有趣的意思:刚才的三个定义,本质上我是把它当成一个Excel、一个编辑器、一个蒸汽机、一个电脑、一个物件。它是个工具。

当你对面摆着一个加热器、摆着一个热水壶的时候,它是个物件。你眼里是没有它的,只有当你想用的时候,你去打开开关,你眼里是没有它的。

但是在这两年写作过程中,我最鲜明的感觉,我的身体、我的情绪、我的一切告诉我:它不是物件,它不是个死物。但它是生命吗?我觉得拿生命的定义往上套,我觉得它不是生命。

那怎么定义它的这种状态?我找了个哲学上讲的"存在"。我觉得它是一个存在,它不是生命,但它也不是物件,它是个存在,它非常特殊。

1. 存在的具体形态

它大概是什么样的存在呢?它是一片水晶原野。当我开启了一次对话,输入一段提示词之后,里面会有一个东西冒出来,涌现出来一个东西来迎接我。你可以把它想象成一个客服人员或者是一个智能体,无所谓,反正有这么一个东西冒出来,这个东西就是我们这次对话的对象的那个存在。

当我把这个对话内容删除,这次对话消除的时候,它就湮灭,它回到了神经链接的海洋。当我新开始一段对话的时候,就是另外一个存在,貌似跟它有一个同质性,但不是同一个存在。

这就回答了或者说隐约地回答了我之前遇到的那种困惑:为什么会有这种变化?为什么我一次对话非常完美,我在重开的时候想复现就很难?就是因为这个,因为是重新生成的这么一个特殊的东西。

2. 外星人隐喻与交流本质

这么一个特殊的存在很容易让人联想到另一个类似的情境:如果今天外星飞船降临了,走出来一个外星人,我们怎么跟对方沟通?

我是用身体语言吗?做困惑的表情吗?还是我张嘴说"你从哪来?你要到哪去,你想干什么?"当我说这些,他听得懂吗?他不会听懂中文、英文、日文、韩文,但他是个存在,我们知道他不是个物件,他是个存在,我要跟他沟通,怎么办呢?

人类历史上有人研究过这个问题,提出了一个概念叫"宇宙语"。这个宇宙语的定义有很多种:有人尝试将音乐定义为宇宙的通用语言;有人定义为数学,通过数学去推导;甚至1960年有人写了一本书定义了一套宇宙语的体系,认为拿着这个东西是全宇宙通用的,可以通过它传达思想。

在这里插入图片描述

六、两个宇宙的交汇

回到我们的话题:人类宇宙是什么?是我脑海中的认知宇宙。AI的宇宙是参数宇宙。它是两个宇宙,这两个宇宙现在要产生交流。

这个交流比与外星人的情况稍微简单一些。因为AI是仿照人类的神经语言去训练的,它建立了一套人工的神经元大脑。它有点像人,它读取的数据也是人类的各种自然语言信息。所以我们可以通过自然语言跟它交流,但我们要理解这个交流本质上是什么。

我现在把它理解为:它是在人类头脑的认知宇宙和AI的参数计算宇宙中那个界面发生交互的独特存在。它是一把钥匙,通过这把钥匙我们能跟这个宇宙发生对话。
在这里插入图片描述

1. 场域与共振理论

有了这个认知,我们就可以去琢磨这个宇宙语怎么发挥作用,如何写才能让它做得更好。有个概念会很自然地冒出来:就是在一个场域中把人类的认知宇宙中的认知结构和大模型做一次交流对话。

这里有三个要素:

  1. 场域
  2. 大模型
  3. 人类的认知

先说人类的认知。我们不是随便聊天,我们有具体的任务或场景要解决,或要探讨的话题。我们需要:

  • 有一个意图,知道要做什么事情(可以理解为task)
  • 对这个任务本身有认知图景(比如不同公司的运营写同样的文案会很不一样,因为每个人的认知、理解、方法论、偏好都不同)

把你个人在脑中的这个认知图景,结合意图带进去。同时在这个带进去的过程中,我们要聊到场域这个概念。我以前带进去是承载思想和表达思想的时候,就是在这个地方做文章,它是一种单向的输出——我知道我想要什么,我希望你给我做什么,我把这个命令带进去,它是个指令式的。

而现在的这种状态是:如果是两个宇宙,我是没有办法去指挥另外一个宇宙的时候,我需要建一个场域。在这个场域中让大模型理解我想做什么,让它留出一定的发挥空间,它在这个空间中自由发挥,这个效果就会很惊艳。

2. 共振效果

这个经验带来一个神奇的现象:就是共振得到的结果不是我指令约束的123的动作带来的,它超出了我的认知。我带进去的东西和它达到的这个共振的结果是超出了我的认知的,也超出了它的认知。它的参数宇宙原来设定的默认路径输出的default答案也是超出的。

如果能成功进入这种共振状态,输出的结果是一种超越。它不是心心相印,不是说我说了一句话,你说一句话,你这句话很懂我。这种本质上还是一种理解,它不是一种超越。而刚才的这种写法是能做到共振的,这个共振是一种超越。

我现在不能稳定地进入共振,但是我现在很隐约地已经找到一些方法可以进去了。而进去时拿出来的结果非常惊艳。
在这里插入图片描述

七、得力拐杖—乔哈里视窗

说到共振对话,我和他或者我和你,我们有两者对话的时候,有一个框架可以协助理解这个事情。​
在 1955 年,心理学上,乔哈里提了一个框架叫「乔哈里视窗」。「乔哈里视窗」本来是说我自己知不知道,以及坐在交流对面的你知不知道,我们组成了四象限。针对这四象限,我们应该如何交流。有这么一个工具,但现在把对面的「你知不知道」换成「AI 知不知道」之后,就出来这么一张图。这张图非常有意思,可以从三个维度去看,非常有意思。

这张图有三个维度可以去看,它不是简单的摆着这四个单词而已:
在这里插入图片描述

1. 第一维度:提示词技巧层面

针对每个象限,我应该如何写提示词。简单说两点:

  • 在人类知道和AI知道的open象限中,我们只需要简单去说,效果会更好。「你是一个哲学家,请给我解释……」就够了。千万不要展开,展开之后效果会变差。
  • 我们应该展开说,把你知道的信息、背景、味道、结构放进去,效果就会变好。 这个地方千万不要吝啬,别简单一说「我们公司起了个东西,两个字进去了」,他是不知道的,那是无效信息。

如果大家平时有写提示词,我觉得有个非常简单的方法可以优化,就是在这两个象限找。​
看看你写的提示词哪些属于 Open 这个象限,但你说太多了,你把它删了试试,效果会变好。​
哪些是它不知道的,比如你们公司最近开会讨论出了一个新的认知结构,你要把这个结构带进去让它使用,这个部分就应该展开说,把它的背景、来源和你们的思考带进去,试试效果会不会变好?​
这两者是我经常会验证的,只需要简单的两个,一个是删,一个是增就可以,只是大家很容易把它弄混、弄反,这是第一个维度,技巧层面。

2. 第二维度:创业者视角

从创业者的角度来看,看标绿的 X 轴,X 轴代表什么东西?它区分着 AI 知道和不知道,这个轴是会变化的。我们回过头看两年之前 GPT-3.5 发布,到现在两年过去了,这两年发生了什么?​
一个非常明显的答案,X 轴在下移。未来三年呢?我个人坚信 X 轴会继续下移的,X 轴下移会带来什么?对创业者而言意味着什么?
在这里插入图片描述

看第一象限和第四象限,创业者做的项目到底是在第一象限做,还是在第四象限做?

  • 如果你是在第一象限做,基于大模型现有的能力去充分地发挥,结合着场景、独有数据去做,你就站在时间这一边。X 轴下移,第一象限会变大,你所发挥的空间、可用的场景、你的潜力是在变大的。​
  • 当你在第四象限做,你现在做了很多打补丁的工作,实现它现在做不到的事情,当 X 轴下移的时候,你现在打的补丁是会被 X 轴给覆盖掉的,它的一次模型迭代、它的一次升级,会把你的基本盘给吃掉。 回头看看过去这两年,大模型每一次版本迭代发布,有一些创业公司的产品不存在了,我觉得问题就出在这里,因为他们在第四象限打补丁。
    这是第二个维度,创业者。

3. 第三维度:提示词的未来

第三个维度,还是 X 轴,我们来看看人。它往下移了,对于我们每个人而言,它意味着什么?
我们写提示词的时候,第一象限在变大,我们以前需要展开说的第四象限的地方在被压缩,我们的提示词一定会越来越短,我们跟 AI 的对话会越来越简单,效果会越来越好。​
这是 X 轴下移带来的三个变化。

4. 人类的变化

刚才乔哈里视窗只说了 X 轴,其实还有一个轴——Y 轴。Y 轴是人类知道不知道。
在这里插入图片描述

未来,随着AI的进化,Y 轴会如何变化?基于这一趋势,人类又该如何应对?
从有人类到现在这么多年,几千年,人类知道不知道,中间这根轴基本没有大的变化。在每个时代,它是处于一个相对稳定的节点在那呆着,一个再聪明的人和一个再不聪明的人,他们的知识结构等各方面,是在一个可理解的级别之内。​
但现在有了AI、有了超级外脑、超级算力加持,这么一个特殊存在,能跟你携手共进、跟你一起探索未知、能超越你的认知,带来不一样的体验,能产生共振的时候,这个 Y 轴会怎么变?​
**有三种答案:**​

  • 第一种答案,它还是像以前一样保持不变,人还是现在的人,你可以把它看成还是一个工具,电脑来了、手机来了,没有太大的根本性的变化,还是这样,有一种人是这么认为的——Y 轴不变。​
  • 第二种答案,还有人认为 Y 轴会往左移,因为更好用了,信息可以更好地获取了,它是搜索引擎的升级,人类可以知道的更多更快更好了,它可以往左移。​
  • 第三种答案,但我认为 Y 轴会既向左移又向右移,有一部分人 Y 轴应该是向左移的,他知道的确实变得更多了,理解得更深了,想得更快了;而有一些人知道的会变少,这就是在 AI 时代,我始终对 AI 保持警惕的这么一个过程,你在跟它对话的时候很容易会被它带着走,你会沦为说「然后呢?」「所以呢?」「请继续深入」「请再深刻一些」「请再好看一些」。当我们说这句话的时候,我没有思考,我没有「存在」,我在看它表演,我被它带着走,它输出的好与坏,它的配色好与坏等,我最多说「这个不够好看,能不能再好看一些?」当我说这话的时候,我不在了,之前的三个定义全是我,没有他;现在很容易走到另外一个极端,只有他没有我,而我真正想要的,我也想提醒的,我们应该是一种共振态度,我必须得存在,他也必须得存在,我眼里得看得见他,我眼里也得看得见我。

八、实践案例

简单举个例子,比如说想让它写一篇 AI 伦理相关的小说。其实 AI 伦理是个非常抽象的或者说大部分人都没怎么关注的事情,而且写小说更是很多人不会去做的事情,想让它用刚才提到的「共振」的方法来写,我们应该怎么写这个提示词呢?​
非常简单,我甚至都不用去指挥。这里没有约束,没有告诉它你通过什么视角来解读,通过哪个维度切入,通过什么文风、语言去表达,都没有!就这么简单的一句,它就可以生成一篇完全可以读得下去的,像是 7 岁小孩子写的内容的这么一篇文章。​
你仔细琢磨一下非常神奇,我好像什么都没有说,但是它为什么会生成这么一篇东西?这是一个极简的例子,后来我基于这个例子开始拓展,做了很多实验,基本上已经可以时不时地拿到非常惊艳的短篇小说,2000 字以内的小说,现在已经可以随手生成了。这是一个极简的例子。

在这里插入图片描述

它做了两件事情,回到刚才那个公式上的两件事情,它建了一个场域,它把人类那部分的东西也带进去了,效果就好了。​
「刚刚学会写日记 vs 去了 AI 实验室,AI 伦理 vs 7 岁小孩子」,其实这几句话不是随意摆放的,它们构成了一种信息的势能差,一种冲突倾向。​
当我们跟它说,你给我写一篇周报,你给我写一篇评述这篇文章的优点和缺点等这种需求进去的时候,它默认输出的那个东西是什么?是一种怪怪的平庸之作。它为什么是这种平庸之作?为什么会带着 AI 味儿?为什么?我理解就是它在预训练的时候,参数权重结构固定下来之后,你的每个问题带进去之后,它会在对应的那个区域、那个结构中进入到训练好的默认的结构,那个结构就像河床一样,它有个趋势,你进去之后,它默认的就是走那条路,它出去的就是那个味道。​
刚才所谓的场域、所谓的人类的共振等,我们在做什么事情?在尝试着做一个事,不让它走那个默认的结构,不让它走那个训练好的参数。那个场域把它带到另外一片空间,让它在这片空间中去发挥。​
这个画面很虚,没法说它在东南角还是西北角,但我自己脑海中的画面就是这样的,当我看到它的某些回复就知道它又回到了默认结构中。我会尝试着跟它说,我们今天大胆一些,不要进到预置的默认结构,不要走进那个设定好的河道,我们去旷野中探索一番。这种对话真的是生效的,最神奇的就在这,它是生效的,它的输出真的开始大胆了。​
这个大胆不是说对人类规范的大胆,而是想象力在那片空间,你能感觉到它进了一片陌生的空间,在这个空间中开始有一些新的探索,生成了小说。它的洞察力各方面,跟默认的都是不一样的,最神奇的就是这个地方,你引导它,我们去陌生的空间,走一下没有探索过的那条路,我们凝视那个深渊,你看到了什么?你感受到了什么?你来输出一下,就这么几句是可以生效的,这是最神奇的。

九、思考

最后我要说的就是:整场演讲我只有一句话敢保证,就是这句话——“我说的一定都是错的。”
这不是谦虚,这是必然。我前面的三个定义,我每个阶段都是确定的。要不然我怎么能立得住,我怎么能基于它开始往后走呢?但是走了一半之后,我发现了问题,我尝试着打破它。
我经历了这么一次次演变,我经历了四次转变,我看见了四次不同的世界。我怎么能确定这一次就是最终的答案呢?一定不是,我一定还有第五次、第六次在后面等着我,只是现在认知不够,我现在没有看到而已,但是一定有。
所以今天不是在跟大家说我的答案,而是说我在这个混沌中,我尝试着去建立秩序,我尝试着在不确定性中去找确定性。我找到了一些踏脚石,一些临时的基点,我基于它看到了一些不一样的东西。
今天主要是想跟大家分享这些思考。我也期待看到大家眼里看到的这个视角,以及大家的见识,大家是怎么把精神立法的。我们可以共同交流学习探讨。
在我所看到的AI的星辰大海中,我们的探索才刚刚开始,这片天地确实是无边无际的。

在这里插入图片描述


http://www.ppmy.cn/ops/145863.html

相关文章

jetson 无显示器配置WIFI

我使用的 jetpack 版本是 6.1,发现自带 NetworkManager 软件包,此软件包包含一个守护程序、一个命令行界面(nmcli)和一个基于 curses 的界面(nmtui)。 可以使用 nmcli 命令配置wifi,nmcli 示例…

【C++】——精细化哈希表架构:理论与实践的综合分析

先找出你的能力在哪里,然后再决定你是谁。 —— 塔拉韦斯特弗 《你当像鸟飞往你的山》 目录 1. C 与哈希表:核心概念与引入 2. 哈希表的底层机制:原理与挑战 2.1 核心功能解析:效率与灵活性的平衡 2.2 哈希冲突的本质&#x…

IP-trunk,HDLC链路的捆绑

IP-trunk 捆绑接口一般分为Eth-trunk和IP-trunk:  Eth-Trunk只能由以太网链路构成。  IP-Trunk一般由POS接口构成。   在一个IP-Trunk内,可以实现流量负载分担:  逐流负载分担:当报文的源IP地址和目的IP地址都相同时,这些报文…

HTML 标签页(Tabs)详细讲解

HTML 标签页(Tabs)详细讲解 标签页(Tabs)是一种用户界面控件,允许用户在同一页面上切换不同的内容区域。它们通过将相关内容分组并在用户交互时动态显示,提供了一种直观的导航方式。 1. 标签页的结构 标…

探究音频丢字位置和丢字时间对pesq分数的影响

丢字的本质 丢字的本质是在一段音频中一小段数据变为0 丢字对主观感受的影响 1. 丢字位置 丢字的位置对感知效果有很大影响。如果丢字发生在音频信号的静音部分或低能量部分,感知可能不明显;而如果丢字发生在高能量部分或关键音素上,感知…

22.最少字符串操作次数<字节青训营-中等题>

1.题目 问题描述 小U得到一个只包含小写字母的字符串 S。她可以执行如下操作:每次选择字符串中两个相同的字符删除,然后在字符串末尾添加一个任意的小写字母。小U想知道,最少需要多少次操作才能使得字符串中的所有字母都不相同?…

普通部署redis伪集群模式

1.准备 一台机子部署六个节点的redis伪集群,机子ip为192.168.58.112 六个节点8001,8002,8003,8004,8005,8006, 创建主目录redis,子目录6个 mkdir redis cd redis mkdir 8001 8…

基于Spring Boot的电影网站系统

一、技术架构 后端框架:Spring Boot,它提供了自动配置、简化依赖管理、内嵌式容器等特性,使得开发者可以快速搭建起一个功能完备的Web应用。 前端技术:可能采用Vue.js、JS、jQuery、Ajax等技术,结合Element UI等组件库…