(注:本文为小报童精选文章。已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费)
讲解的同时,也给你推荐一些实用的学习资源。
AI agent (智能体 / 代理)这个词儿最近非常流行,似乎「大语言模型」和 AIGC 啥的一下子变得过时了。不少小伙伴儿因此又变得焦虑了。不知道是谁,甚至开始散布「若不赶紧学习 AI agent ,你会被时代抛弃」云云,助长焦虑。
其实,AI agent 并不神秘,通过这篇文章的讲解,我希望你能真正了解它到底是什么,从而实现新概念的「祛魅」。之后,如果你觉得自己确实用得上它,再找寻合适的资源深入学习也不迟。只不过,有的付费资源要价有些高到离谱。所以我也会在文中给你推荐一些真正实用且免费的学习资源。
定义
首先,我们要了解什么是 AI Agent。
去年年初 ChatGPT 火了以后,你应该已经用过无数的 Agent 了。你说不对啊,我只是用过一些大语言模型,帮我查资料解问题写代码而已啊。
其实,只要你打开过各种官方的大语言模型交互界面跟它对话,你就已经在用 Agent 了。只是你「日用而不知」而已。
如果你比较细心,会发现在不少大语言模型的会话设置中,系统提示词(system prompt)一般都包含了一句话“You are a helpful assistant”(你是一个非常有帮助的助手)。
这句话非常重要,它是给 AI 一个限定,让它以「助手的心态和行为习惯」来辅助你。你问啥问题,它都来认真回答。为什么它总是那么耐心,那么尝试迎合你的口味(甚至会出现幻觉)呢?因为你是它的雇主啊!
有人可能会问 —— 只要告诉大语言模型这么一句提示,就把它变成了一个 agent 了吗?
没错。这就叫做提示词引导。相当于一个武林初学者已经利用多年时间打下了一套基本功,但还没有精进到更高深的武艺。这时候它需要的,往往不是再来十年基本功训练,而是得有个白胡子老头儿出来,给他一本书,或者告诉他个口诀,他于是立刻就「悟」了。
相对于他学武的几年时间,看这本书、背这套口诀的时间微乎其微。但是这本书、这套口诀(你可以对应想象成提示词)的作用不可忽略。它把一个资质不错,但武功尚处于三流乃至不入流的少年,迅速推到了武学大师的正确快速成长路径上,能够战胜更强的对手。这就是系统级提示词在目前阶段可以带来的质的升华。
为了让你理解这种差别,我给你举个例子。Gemini 1.5 Pro 是天生的多模态 —— 可以看视频,总结视频内容。你给它一段视频,一般预期就是告诉你这段视频里面有什么而已。
但只要加上合适的提示词,Gemini 1.5 Pro 就可以立即把视频的内容通过想象力加工,变成一段颇有些意思的小说。
这里对应的提示词(鱼),以及更进一步复刻提示词的方法(渔),都请你参考这篇文章。
从原理上讲,在对话窗口长度的限制范围内,任何文字内容 Gemini 都可能写出来。但正是因为有了上述系统级提示词的引导,它的回答不再是无聊、平庸的简介,而变成了引人入胜的小故事。这就是提示词发挥的功效——它把一个普通的大语言模型调教成了一个可以通过视频来帮助你进行小说创作的agent。
那究竟什么是 agent 呢?