能大致讲一下Chat GPT的原理吗?

AI视频生成:小说文案智能分镜+智能识别角色和场景+批量Ai绘图+自动配音添加音乐+一键合成视频+百万播放量icon-default.png?t=N7T8https://aitools.jurilu.com/ 话题群精选了三位网友的回答,从不同的角度阐释了Chat GPT的原理。

第一位网友的回答:

不给你扯长篇大论,不扯专业术语。做个一分钟小实验,让你get到GPT的核心原理。我现在给你出个找规律的题:已知1.WSHR2、2.WSHR3、3.WSHRM、4.HRSYHBD。提问:现在有一段话只有开头WS,那后面可能是什么?按照你观察到的规律,你可能会回答:我吧,我看WS后面都是接的HR,而且一、三出现了两次呢。你还有可能回答WSHR和WSHRM也有可能吧,毕竟都挨着WS。低概率你也可能会回答WS YHBD,没准跟W没关系,是跟S有关系呢。你看四里面S后面接的是TB,说不定它是对的呢。但无论如何,你几乎不会回答WSBH、WSMR等等这种毫不沾边的结果。

到现在你可能还都是云里雾里,那么我揭晓谜底:字母实际上是下面这段话内容的拼音缩写。已知一:我是好人,二:我是坏人,三:我是好人吗,四:好人是有好报的。提问:现在只有“我是”两个字,那么后面可能是什么?那么我们再来看回答:实际上是回答一:我是好人,因为已知里面“我是”后面接“好人”的次数多;回答二:我是坏人,我也是好人吗,也有可能,因为跟“我是”挨着;回答三:我是有好报的,说不定也是对的呢,没准跟“我”没关系,主要看“是”后面是啥呢。你几乎不会回答我是报好、我是骂人等等这种语句不通的结果。

虽然你完全不懂这个题目在说什么,但是通过观察意志内容,总结规律,还是能够回答出语句通顺且相对靠谱的答案。那么你这里大概率已经懂了“已知”的内容,实际上就是AI训练时要喂给它的语料;你观察到的规律,实际上就是训练后的模型。AI实际上也是完全不理解你在说什么,你给它看的东西对它来说毫无意义。但这样,当人们提出某些问题时,它就可以根据以前观察到的规律回复出大概率是正确的回答。这也就是现在生成式AI的神奇之处。

第二位网友的回答:

Chat GPT的通俗解释:Chat GPT其实在原理上不难理解,大体上它就是一个超级抠图王、超级电话接线员、超级审核的组合。超级抠图王,平时你抠图会抠一个人或者一个东西下来,对不对?在计算机看来,你就相当于画了一条封闭的曲线,然后把这条曲线里面的所有点都重命名为人或者一个东西了。而Chat GPT具有一个可以把每个像素都重命名为某种东西的功能。它会从粗到细,逐渐把画面分割成为不同的块,然后动用它搜索引擎里预存的已经被人为分好了的那些小块,搜到一个最可能的命名方案,直到这个过程进展到几个像素为止。这个图也就被它扣好了。这一步也叫做模式识别,在工程上来说是相对容易实现的。

不论是语音转写也好,摄像头自动拍人也好,都是这样的一个原理。但是如果我们把这个过程反过来,尝试用抠图的结果反过来求抠图之前的那张图长啥样呢?那就困难很多。比如说我用语音来生成文字稿,现在许多软件能做的相当准确,但是如果你反过来让电脑读文字稿的话,显然有很多当时的细节都无法准确还原了。又比如说,我抠完一张图,将图片的细节完全删掉,只留下这个像素曾经代表啥的信息,比如“车车车车车人车车车车车”这样的。既然你连当时这有什么人,又有什么车都不能确定,你又该怎么把画面细节重新补回去呢?而这就是Chat GPT它非常擅长的内容了。

超级电话接线员 Chat GPT 的科学家意识到一个问题:之所以这个还原很难做,比如说用几个字画张图吧,其实是因为我们没找着那个曾经成功将某张图拆成过你刚才输入那几个字的老师傅。一旦我们把这位老师傅找到了,他回家把当时拆过的那张图给你一找,那很有可能那张图就是你想要的了。

如果有一天你发现无论你说一串什么字,给一张什么图,他总是世界上某几个老师傅当年得出过的结论呢,那是不是只要那群老师傅在他们的结论后都附上他们的电话号码,我们只要给他们打一个电话,就能把图给找出来了呢?原理上还真就是这样的。只不过,在 Chat GPT 里这通电话你可能要联系成千上万个接线员才能接通,但无论如何还是能接通的。

于是将模式识别的逆运算尽可能闭合起来的方法,也就找到了,那就是疯狂做模式识别,然后把模式识别得到的经验存起来,变成找到原图像的电话号码。而这套给经验指派电话号码的方法,也就是大家所熟悉的神经网络了。它本质上就是一个由千万个电话接线员共同去记忆这个世界上的人们是如何打电话的结构,于是每个接线员就可以记忆相当少的内容,不需要特别博学强记,只需要能判断下一个接线员是谁就行了。

如此一来,无论当时的分析过程何等复杂,他的电话号码多么复杂难记,只要我安排足够多的接线员,总有一个相当大的概率能够最终将这通电话给接通。就是这个方法,令 Chat GPT 能够用维度非常小的信息生成出维度非常高的产物,用几个字就可以为你生成一个很复杂的图像——超级审核。

当然在这个过程当中,Chat GPT 还需要在联系到诸多老师傅的同时,将一些比较明显不符合人类需求的结论给剔除掉。显然,你给的信息越少,能联系到的老师傅也就越多,对吧?于是不符合你需求的信息也就越容易将你想要的那个给淹没掉,对吧?这个时候 Chat GPT 就需要人工客服的介入了。

实际上在你使用它之前,人工客服会被模型剔除掉好多好多不符合要求的结果。当然这个过程本身也是可被机器举一反三的,于是在相对而言不那么充裕的人工服务之下,Chat GPT 也可以剔除掉到天文数字一般的错误结论了。固然在这个过程当中错杀肯定不少,但是比起 Chat GPT 庞大的生成能力来说,这点不算什么。

于是在三者的共同努力之下,你就得到了一个能够回答你任何问题,但是偶尔会给你一个非常离谱答案的超级大模型了。实际上它并不是非常难以理解的东西,而且它和人类以及动物真正的智慧发生模式,还是有着相当大的区别的。然而这些和本题关系不是很大,就另作论述吧。

第三位网友的回答:

Chat GPT的基本原理:

1. Transformer架构:

这是一种深度学习模型架构,专门用于处理序列数据,如文本。它引入了注意力机制,允许模型在不同位置关注输入序列的不同部分,从而更好地捕捉长距离依赖关系。就像学生系统的专心的学习一本课程,以更好的理解教材中的内容,形成知识结构。

2. 预训练:

在上个阶段基础上,用大量的文本数据通过处理上下文信息生成自然语言响应。它能够理解先前的对话历史,并根据上下文生成连贯的回答。Chat GPT使用一种称为Being Search的技术,以选择最可能的序列,确保生成的响应既合理又连贯。就像学生通过大量的阅读和听力练习来提高语言能力,从中学习语言的结构和用法。

3. 无监督学习模型:

通过无监督学习从文本中学到的知识可以用于各种自然语言处理任务,包括对话大声称。就像小孩子通过尝试和错误的方式学习表达自己的想法。

4. 微调:

在预训练后,模型通常会在特定任务上进行微调,以适应更具体的应用场景。微调可以使用有标签的数据,以便模型更好地适应特定的任务要求。就像学生考试,老师根据答题质量来帮助学生提高成绩。

总结:

通过这三位网友的回答,我们可以对Chat GPT的原理有一个全面的了解。第一位网友通过一个简单的实验,让我们直观地理解了GPT如何通过观察数据中的规律来生成回答。第二位网友将Chat GPT比喻为超级抠图王、超级电话接线员和超级审核的组合,形象地解释了其工作原理。第三位网友则从技术角度详细介绍了Transformer架构、预训练、无监督学习和微调这四个关键步骤。这些解释共同为我们描绘了一个关于Chat GPT如何运作的全面图景。


http://www.ppmy.cn/news/1520538.html

相关文章

Gateway的基本概念

1.Gateway概念介绍 1.1Gateway介绍 Gateway网络为微服务架构提供简单且统一的API路由管理,作为系统的统一入口。 Gateway可以为客户端提供统一的服务,例如认证、路由转发、防刷、流量控制、监控日志等。 Gateway是无状态的,不存放数据&…

spring boot 项目 跟 JavaScript 简单 websocket 使用

文章目录 websocket 简绍WebSocket 的优势包括:JavaScript 设置处理事件 Java 服务端设置导jar包创建WebSocket端点EnableWebSocketregisterWebSocketHandlers 实现WebSocket处理器afterConnectionEstablishedafterConnectionClosedhandleTextMessage 注销WebSocket…

C# 使用微软OFFICE库操作excel

C# 使用微软OFFICE库操作excel写入数据 using System; using Excel Microsoft.Office.Interop.Excel;namespace ExcelExample {class Program{static void Main(string[] args){// 创建Excel应用程序实例Excel.Application excelApp new Excel.Application();// 让Excel应用…

Python 读写 Excel 文件:创建、遍历、更新与样式处理

Excel 是广泛使用的电子表格软件,用于数据存储、分析和可视化。Python 通过第三方库如 openpyxl 和 pandas 提供了丰富的功能来读写 Excel 文件。本文将详细介绍如何使用 Python 进行 Excel 文件的创建、遍历、更新、删除以及样式处理等操作。 1. 安装必要的库 首…

【计算机网络】socket编程 --- 实现简易TCP网络程序

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 如果文章对…

【Pytorch实用教程】tqdm的作用:在循环中显示进度条

tqdm 是一个 Python 库,用于在循环中显示进度条。它能够为任何可迭代对象(例如列表、生成器、数据加载器等)添加一个可视化的进度条,使用户可以实时查看程序的执行进度。 在数据科学和机器学习领域,tqdm 经常用于显示训练和验证过程中的进度。例如,在训练神经网络时,由…

编译 ffmpeg 以支持AVS格式视频解码与解码

前言 当前文章介绍如何在Linux下使用FFmpeg转码其他视频格式到AVS格式的指南,包括编译FFmpeg以支持XAVS编码和如何使用FFmpeg进行转码。 AVS (Audio Video Coding Standard) 格式是一种由中国主导制定的视频编码标准,全称为“中国数字音视频编解码技术…

装饰器模式及应用【理论+代码】

装饰器模式(Decorator Pattern)是一种结构型设计模式,它允许向一个现有的对象添加新的功能,同时又不改变其结构。这种设计模式通过创建一个包装对象,即装饰器,来封装实际对象。 装饰器模式的主要组成&#…

图像处理之透视变换

透视变换 什么是透视变换透视变换有什么用 什么是透视变换 透视变换(把斜的图变正,也就是一种坐标系到另外一种坐标系)是一种图像处理技术,它利用透视中心、像点、目标点三点共线的条件,按透视旋转定律使承影面&#…

python读取excel数据

在处理Excel数据时,Python 提供了多种强大的库来读取、处理以及分析这些数据。最常用的库之一是 pandas,它建立在 numpy、matplotlib 和 scipy 等库之上,为数据分析和操作提供了高级的、易于使用的数据结构和数据分析工具。另一个流行的库是 …

Java设计模式—策略模式(Strategy)

模式动机 完成一项任务,往往可以有多种不同的方式,每一种方式称为一个策略,我们可以根据环境或者条件的不同选择不同的策略来完成该项任务。在软件开发中也常常遇到类似的情况,实现某一个功能有多个途径,此时可以使用…

【运维监控】prometheus+node exporter+grafana 监控linux机器运行情况(2)

本示例是通过prometheus的node exporter收集主机的信息,然后在grafana的dashborad进行展示。本示例使用到的组件均是最新的,下文中会有具体版本说明,linux环境是centos。本示例分为四个部分,即prometheus、grafana、node exporter…

【MySQL】如何优化 SQL UPDATE 语句以提升性能

如何优化 SQL UPDATE 语句以提升性能 在日常开发中,优化 SQL 查询是非常关键的一项任务,尤其是在处理大量数据时。本文将通过一个 UPDATE 语句的优化过程,探讨如何提升 SQL 性能。 示例场景 假设我们有以下两张表: 表 table_a…

打造一流的研发型企业--- 金发科技研发驱动力初探

2006年3月29日,国家发改委副主任欧新黔亲自为金发科技颁发了“中国改性塑料行业第一位”、“中国合成材料制造业十强”、“中国石油化工全行业百强”三块铜牌证书,金发科技终于成为名符其实的行业“老大”。公司产品销售额增长迅速, 2006年完…

开发基础软件安装地址(持续更新中)

开发基础软件安装地址(持续更新中) 如果需要新增下载工具可以在评论中留言 欢迎广大开发人员在评论区讨论关于环境安装遇到的问题 正文会持续更新。。。 java常用的jdk1.8版本安装包 链接:jdk-8u421-windows-x64.exe idea java常用的开发工具…

提交保存,要做重复请求拦截,避免出现重复保存的问题

**问题:**前端ajax提交数据的时候,当频繁点击的时候,或者两个账号以相同数据创建的时候,会出现问题。 **处理办法:**前端拦截,防止重复提交数据,在上一次请求返回结果之后才允许提交第二次&…

在 Debian 8 上安装 Nginx 的方法

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 介绍 Nginx 是一个流行的 HTTP 服务器,是 Apache2 的一个替代品。它可以用作反向代理、邮件服务器或 Web 服务器。根据 Net…

[某度信息流]SQL164,2021年11月每天新用户的次日留存率

牛客网在线编程 思路: 首先找出用户的注册日期,即date(min(in_time)) 转成date形式 建立两个辅助表,我先放代码,然后进行解释 withuser_reg as (selectuid,date(min(in_time)) as first_datefromtb_user_loggroup by1),…

抖音视频如何下载保存到相册:详细教程

随着抖音的风靡,越来越多的人沉浸在短视频的世界中,观看各种搞笑、有趣、甚至感人的视频。很多用户都希望能够将喜欢的抖音视频保存到自己的手机相册中,方便随时观看或分享给朋友。本文将详细介绍如何下载抖音视频并保存到相册的方法。 一、…

记录Jmeter 通过view result tree配置保存响应信息的方法以及命令行运行时的一个坑

大家在使用Jmeter进行调试时有没有考虑过这个问题,如何查看具体的响应信息,特别是通过命令行执行脚本的时候,如何看到具体请求的响应信息呢? 看到上面这个问题,首先想到的就是我们平时在jmeter中debug问题&#xff0c…