ChatGPT的技术路线

news/2025/3/15 3:42:23/

目录

  • ChatGPT的技术路线
    • 基于 GPT-3.5,GPT-4 预计提升更明显
    • GPT、Bert 均源自 Transformer 模型
    • 领先的 NLP 模型
    • RLHF 与 TAMER 是重要架构支撑


ChatGPT的技术路线

基于 GPT-3.5,GPT-4 预计提升更明显

ChatGPT 是基于 GPT-3.5 的主力模型。在互联网开源数据集上进行训练,引入人工数据标注和强化学习两项功能,实现“从人类反馈中强化学习”。相比之前的模型,ChatGPT 可以更接近人类思考的方式,根据上下文和情景,模拟人类的情绪和语气回答用户提出的问题。OpenAI 首席执行官称,GPT-4 有望成为多模态的人工智能。GPT-4 的参数预计更大,计算模型优化有望实现更优化,且 GPT-4 将是纯文本模型,更具备“拟人化”的功能。文本生成和内容创作有望更加丰富,并有望进入文字工作的相关领域,例如新闻、金融等相关行业。

GPT、Bert 均源自 Transformer 模型

NLP 模型首选——Transformers。2017 年由 Google Brain 团队推出深度学习模型 Transformer,采用自注意力机制,对输入数据的每一部分的重要性进行差异加权,主要用于自然语言处理(NLP) 和计算机视觉(CV)领域。BERT(Bidirectional Encoder Representations from Transformers )为谷歌于 2018 年推出的一种基于神经网络的 NLP 预训练技术,BERT 在情绪分析和回答问题等分类任务中表现良好,在命名实体识别和下一句预测方面也表现出色。ChatGPT 同样是根据语言/语料概率来自动生成回答的每一个字(词语),即利用已经说过的语句作为输入条件,预测下一个时刻语句出现的概率分布。

领先的 NLP 模型

ChatGPT 是一个出色的 NLP(Natural language processing-自然语言识别)新模型。NLP 随算力增长突破:在过去的十年里,通过使用简单的人工神经网络计算,基于以 GPU、TPU 为代表的强大算力资源,并在巨量的数据上进行训练,自然语言处理(NLP)取得了令世人瞩目的成就和突破。自然语言处理最重要的进步在于它对书面文本的分析能力。

RLHF 与 TAMER 是重要架构支撑

  • RLHF:InstructGPT/GPT3.5(ChatGPT 的前身)与 GPT-3 的主要区别在于,新加入了被称为 RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)。
  • 循环:训练范式增强了人类对模型输出结果的调节,整个训练过程是人类、代理对目标的理解和 RL 训练之间的 3 步反馈循环。
  • 在 InstructGPT 中,以下是“goodness of sentences”的评价标准。真实性:是虚假信息还是误导性信息?无害性:它是否对人或环境造成身体或精神上的伤害?有用性:它是否解决了用户的任务?

TAMER(Training an Agent Manually via Evaluative Reinforcement,评估式强化人工训练代理)框架将人类标记者引入到 Agents 的学习循环中,可以通过人类向 Agents 提供奖励反馈(即指导Agents 进行训练),从而快速达到训练任务目标。通过 TAMER+RL(强化学习),借助人类标记者的反馈,能够增强从马尔可夫决策过程(MDP) 奖励进行强化学习 (RL) 的过程。

我们的 ChatGPT 模型是基于 GPT-3.5,并添加了 RLHF 的支持。我们相信,这个模型将在未来的 NLP 领域发挥重要作用,为人类带来更多便捷和创造价值。


http://www.ppmy.cn/news/39410.html

相关文章

使用GIS空间分析进行植物生长区域选址

经过观察可以发现某种珍贵植物在山区的某个区域位置生长状况明显要比其他区域好很多,通过研究了解到这种植物生长具有严格的生长条件。为了能更好地保护该种植物的生长环境,现在需要使用GIS空间分析方法,将适合植物生长的区域找出来。 树谷资…

Ruby设计-基础语法

一、脚本语言 ​ 我似乎对于 Python 和 Ruby 强求太多了,我要让他们实现 C 的所有功能。他们确实可以实现所有的功能,但是他们的目的不是为了这个。 ​ 我也可以用 shell 实现很多复杂的算法,但是我绝对不会用他去写图着色或者动态规划。但…

TypeScript01-基础知识

基础类型 boolean 类型 let isDone: boolean false; // ES5:var isDone false;number 类型 let count: number 10; // ES5:var count 10;string 类型 let name: string "semliker"; // ES5:var name semlinker;Symbol 类…

Esp8266+阿里云+STM32点灯(二)

目录 1、简介 2、阿里云配置 2.1添加设备 2.2 发布设备 3、根据参数使用AT指令配置ESP使设备上线 1、简介 完成ESP8266固件烧录后,进行ESP8266模块连接阿里云。 2、阿里云配置 2.1添加设备 点击主页右上角控制台,如下图所示: 接着搜索物…

4.5--计算机网络之基础篇--2.网址到网页解析--(复习+深入)---好好沉淀,加油呀

1.浏览器做的第一步工作是解析 URL 对 URL 进行解析,从而生成发送给 Web 服务器的请求信息 URL? URL 实际上是请求服务器里的文件资源 当没有路径名时,就代表访问根目录下事先设置的默认文件,也就是 /index.html 或者 /default.html 这些文件…

Vue3电商项目实战-结算支付 3【05-结算-收货地址-添加、06-结算-收货地址-修改、07-结算-提交订单】

文章目录05-结算-收货地址-添加06-结算-收货地址-修改07-结算-提交订单05-结算-收货地址-添加 目的:实现收货地址的添加。 大致步骤: 独立组件,准备一个对话框完成表单布局完成确认添加操作 落的代码: 1.独立组件,准…

ChatGPT中文免登陆-ChatGPT中文版上线

ChatGPT不支持地区 ChatGPT 是一个开源平台,可在全球范围内使用,不应该存在地区限制。然而,由于某些原因,可能有地区对 ChatGPT 的访问有限制或屏蔽的情况。 如果您发现自己无法访问 ChatGPT,可以尝试以下解决方法&a…

ChatGPT的失败,是认知的失败,也是理解的失败

当下正在发生的事情,我们早已经历过,而且不止一次。当下以及可见的未来,ChatGPT除了“比人类更有效地”完成报告和写作等“智能”任务外,更多的恐怕是更多的“想象”了!现在不是一些未知的东西正在做我们不知道的事情&…