AI学习有感

server/2025/3/9 20:21:33/

和前辈聊天,谈到了现在的ai技术,这里对那天的谈话进行总结:

AI是无状态的

        我们在使用ai时有时候会有一个错觉,认为和ai聊天久了,ai就会像人与人之间交流一样,会保留一种对聊天对象的认知状态,这里是不正确。

         ai本质上是没有token状态的,并不会因为之前的聊天记录而对你产生认知,如下:

我们在使用ai时,本质上应该每次对话ai都不会保存之前的状态(也可以说是前提),但是在一次会话中,为什么ai会一定程度上结合之前的对话给我们提供回答呢,这里其实是ai的后台在每次我们在一个会话中发送消息时,会把之前我们的对话进行递归,在后端ai会模拟一个用户和他进行对话,以此为前提,再生产新的回答,所以我们在与ai聊天记录多了之后,会发现ai的反应会变慢。

AI的学习方式

监督性学习

对监督性学习进行举例,比如说我们拿一张猫的图片,告诉ai这是猫,拿一张狗的图片,告诉ai这是狗,将此行为重复10万次,ai会根据人的给出的定义,找到猫和狗的图片的共性,这时候我们再拿一张图片给ai,它就会根据之前训练学习的结果通过特征来判断这是猫还是狗。

非监督性学习

对非监督性学习进行举例,比如就拿b站上的热梗,”哈基米“(日语中蜂蜜的意思,国内好多人认为是猫的意思),在全民制作人的努力下,各种鬼畜歌曲中,”哈基米“后面大概率会跟“叮咚鸡”,小概率会跟“胖宝宝,好胖好可爱”,这时候我们拿这些鬼畜歌曲去训练ai,ai的算法应该要在后端生产一个向量链网,链接这些热词之间的关系,拿以上例子进行举例:

”哈基米“到”叮咚鸡“的概率大,则此时由”哈基米“到”叮咚鸡“的向量距离为700

”哈基米“到”胖宝宝,好胖好可爱“的概率小,此时的向量距离就为1200

此时,我们给ai发”哈基米“时,ai就会在训练的向量链网中寻找到”哈基米“,然后去找”哈基米“的哪个向量距离最短,然后给我们进行回答。

上述举例是一个非常简单的案例,实际情况可能还要对之前的会话进行递归再进行判断,比如说之前用户可能提到了赛马娘,此时距离”哈基米“最近的向量可能是动漫中的东海帝皇唱的歌曲。

强化学习

该方式训练ai的成本花销特别大,我们以下围棋的阿尔法狗进行举例,强化学习的核心是奖励机制和递归,比如阿尔法狗在下围棋时,每一步落子,我们都会对该落子进行判断,该落子对棋局的输赢是否有关键性的影响,如果是妙手,我们则奖励ai1分,如果是恶手,则奖励ai-1分,如果没有什么影响,则不加分(当然实际情况可能是根据情况判断给0~1分之间任何值),当一盘棋下完后,ai将递归回去,一步一步的判断在当前情况,每一步棋在每一个位置的奖励分数,然后进行记录,在之后下棋时,再出现类型情况,选择奖励分值最大的一种下法,当每一步下的位置分值都最大,则最终会获得胜利。

总结:

三种训练方式之间,第三种是对第一种和第二种训练方式的增强,而第一种和第二种之间的区别,是监督性学习会人为的给出定义,而非监督性学习是ai通过大量数据统计,自行生成关联向量网来进行学习,前者会消耗大量人力资源,后者则会容易被错误数据信息误导。

AI的实现思路:

我们已知ai是无状态的保留的,那我们在自己实现ai时,对于专用ai,就要提前对其进行相关知识专业训练,但是在训练ai时,难免会造成知识之前的污染,比如上述的”哈基米“案例,指向”叮咚鸡“的”哈基米“和”东海帝皇“的”哈基米“明显不是一个意思,此时ai在用一个”哈基米“向量指向二者时明显是不合适的,这时候我们就要有ai节点管理这个概念了。

我们在编写程序时都知道,一个面向前端的接口,会有三层(web、service、dao)甚至四层(web、interface、service、dao)的处理架构,各个模块之间相互引用和交互,在实现ai时也是如此,我们也要将ai分成多层,在每层上进行训练。

依旧是使用”哈基米“这个热梗进行举例:

在这个案例中,我们简单的将ai分为两层,接口层和服务层

对于接口层,当用户输入关于”哈基米“的时候,ai要对用户的意图进行判断,判断用户是”爱猫人士“还是”动漫爱好者“或者两者都不是,这里我们称为”路人“

当ai判断用户是”爱猫人士“时,则将其会话内容推送给服务层的ai,这里我们称之为”爱猫tv“,我们会提前对”爱猫tv“进行相关知识的训练(即向量指向”叮咚鸡“),然后”爱猫tv“会对接口层的用户会话进行一次递归,根据它的关联向量网给用户提供回答;反之若是”动漫爱好者“,接口层就会将会话推送到另外一个ai进行处理。

如果ai判断是”路人“的话,他只是想简单了解一下一个”哈基米“都是什么意思,对于这种简单的问题,ai就可以在接口层就对用户进行回答,没有必要进行专业的深度训练回答。

还有一种特殊情况,ai发现这个人刚开始时是”动漫爱好者“,在经过一段时间后,发现其提问又偏向”爱猫人士“,这是服务层之间也可以进行推送,将该会话推送给”爱猫tv“。


http://www.ppmy.cn/server/173752.html

相关文章

GB28181视频监控流媒体平台LiveGBS如何自定义收流端口区间以便减少收流端口数或解决端口冲突问题

LiveGBS GB28181流媒体服务在接收视频的时候默认是使用30000-30249, webrtc流播放端口区间默认是UDP的30250-30500区间。有些网络环境不方便开放这么大的端口区间,下面介绍下如何修改配置这个区间。 从页面上修改这个区间,端口区间尽量设置大…

EXCEL自动化13 | 批量重命名工作簿中的工作表

目录 一. 重命名工作表1. 修改单个文件的工作表2. 修改单个文件的多个工作表3. 替换文件中的所有工作表名二. 批量重命名多个文件的工作表如下图所示,文件夹下有6个excel文件(工作簿)。打开任意一个工作簿,可看到其中有工作表,如 Sheet 1 。 要将6个工作簿中的工作表 “S…

Java多线程与高并发专题——关于CopyOnWrite 容器特点

引入 在 CopyOnWriteArrayList 出现之前,我们已经有了 ArrayList 和 LinkedList 作为 List 的数组和链表的实现,而且也有了线程安全的 Vector 和Collections.synchronizedList() 可以使用。 首先我们来看看Vector是如何实现线程安全的 ,还是…

类和对象:

1. 类的定义: 1. 类定义格式: 对于我们的类的话,我们是把类看成一个整体,我们的函数里面没有找到我们的成员变量,我们就在我们的类里面找。 我们看我们的第二点: 我们的类里面,我们通常会对…

01.04、回文排序

01.04、[简单] 回文排序 1、题目描述 给定一个字符串,编写一个函数判定其是否为某个回文串的排列之一。回文串是指正反两个方向都一样的单词或短语。排列是指字母的重新排列。回文串不一定是字典当中的单词。 2、解题思路 回文串的特点: 一个回文串在…

大学至今的反思与总结

现在是2025年的3月5日,我大三下学期。 自大学伊始,我便以考研作为自己的目标,有时还会做自己考研上岸头部985,211,offer如潮水般涌来的美梦。 但是我却忽略了一点,即便我早早下定了决心去考研,但并没有早…

[Lc7_分治-快排] 分治 | 颜色分类 | 快速排序

目录 分治 1.颜色分类 题解 2. 快速排序 题解 分治 分治思想就如同它的名字一样:分而治之 将一个大问题 划分成若干个相同或者相识的子问题。然后在将子问题在划分成若干个相同或者相识的子问题,运用递归,直到划分到不能在划分。然后 …

【大学生体质】智能 AI 旅游推荐平台(Vue+SpringBoot3)-完整部署教程

智能 AI 旅游推荐平台开源文档 项目前端地址 ☀️项目介绍 智能 AI 旅游推荐平台(Intelligent AI Travel Recommendation Platform)是一个利用 AI 模型和数据分析为用户提供个性化旅游路线推荐、景点评分、旅游攻略分享等功能的综合性系统。该系统融合…