ChatGPT新进展GPT-4 模型介绍

news/2024/11/29 2:28:31/

文章目录

    • 背景
    • 工具
    • 功能
    • 使用
    • 增强

背景

2023.3.14 GPT-4 模型发布
创建了GPT-4,这是OpenAI在扩大深度学习方面的最新里程碑。GPT-4是一个大型多模态模型(接受图像和文本输入,输出文本输出),虽然在许多现实场景中不如人类,但在各种专业和学术基准上表现出与人类相当的性能。
在这里插入图片描述
GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。

这是一个大规模的多模态模型,可以接受图像和文本输入并产生文本输出。虽然在许多现实场景中,GPT-4的能力不如人类,但它在各种专业和学术基准上表现出了人类的水平,包括以大约前10%的成绩通过模拟律师资格考试。GPT-4是一个基于transformer的预训练模型,用于预测文档中的下一个令牌。训练后的调整过程会提高对事实的衡量和对期望行为的坚持。这个项目的一个核心组成部分是开发基础设施和优化方法,这些方法可以在大范围内预测行为。这使得我们能够准确地预测GPT-4性能的某些方面,基于不超过GPT-4计算量的千分之一的训练模型。

工具

ChatGPT
API (with a waitlist).
OpenAI evalals 自动评估AI模型性能的框架

功能

在日常谈话中,GPT-3.5和GPT-4之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就显现出来了——gpt -4比GPT-3.5更可靠、更有创造性,并且能够处理更细致的指令。
在这里插入图片描述

我们还在为机器学习模型设计的传统基准上评估了GPT-4。GPT-4大大优于现有的大型语言模型,以及大多数最先进的(SOTA)模型,其中可能包括基准特定的制作或额外的训练协议:
在这里插入图片描述
我们也在内部使用GPT-4,这对支持、销售、内容审核和编程等功能有很大影响。我们还使用它来协助人类评估人工智能输出,开始了我们对齐战略的第二阶段。

60秒生成游戏
在这里插入图片描述
支持输入图片
在这里插入图片描述
在这里插入图片描述

使用

GPT-4仅限ChatGPT的Plus订阅用户使用,其他用户需要排队申请内测。

由于GPT-4提供了图像理解功能,其区分了输入端(即文本和图像形式的prompt)和输出端(生成文本)。

API

在GPT-4 8K版本中,输入端的价格为每1000个Token (约750个单词)0.03美元,输出端的价格为每1000个Token 0.06美元;在GPT-4 32K版本中,输入端为每1000个Token 0.06美元,输出端为每1000个Token 0.12美元。

相比之下,3月1日发布的GPT-3.5 Turbo 的API价格仅为每1000个Token 0.002美元。此前个人创业者王绍在接受每经记者采访时曾表示,基本上是每1000个汉字大约3分钱的成本。

若按此计算,GPT-4 32K版本的输出端价格达到了每1000个汉字大约1.8元,是GPT-3.5 Turbo的60倍,明显成本大幅增加。
图片opentai

增强

  • 先进的推理
  • 复杂的指令
  • 更多的创造力

引用
https://openai.com/research/gpt-4


http://www.ppmy.cn/news/32682.html

相关文章

Unity AR应用(人脸识别)手把手教程

Unity官方有个教程,照着一步一步操作,就能做出一个典型的AR应用:人脸识别虚拟穿戴。其实,人脸识别和跟踪都是设备平台实现的功能(如Android的ARCore或iOS的ARKit),在Unity里只是进行配置工作。真…

RK3568平台开发系列讲解(网络篇)使用socket建立TCP连接

文章目录 一、服务端1.1、socket: 创建套接字1.2、bind: 设定电话号码1.3、listen: 接上电话线,一切准备就绪1.4、accept: 电话铃响起了二、客户端三、TCP 三次握手🚀返回专栏总目录 沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇我们将分别从服务端和客户端的…

计算机网络的基本组成

计算机网络是由多个计算机、服务器、网络设备(如路由器、交换机、集线器等)通过各种通信线路(如有线、无线、光纤等)和协议(如TCP/IP、HTTP、FTP等)互相连接组成的复杂系统,它们能够在物理层、数…

普通Java工程师 VS 优秀架构师

1 核心能力 1.1 要成为一名优秀的Java架构师 只懂技术还远远不够,懂技术/懂业务/懂管理的综合型人才,才是技术团队中的绝对核心。 不仅仅是架构师,所有的技术高端岗位,对人才的综合能力都有较高的标准。 架构路线的总设计师 规…

朋友去华为面试,轻松拿到26K的Offer,羡慕了......

最近有朋友去华为面试,面试前后进行了20天左右,包含4轮电话面试、1轮笔试、1轮主管视频面试、1轮hr视频面试。 据他所说,80%的人都会栽在第一轮面试,要不是他面试前做足准备,估计都坚持不完后面几轮面试。 其实&…

ChatGPT-4震撼发布

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于…

chrome快捷键

Ctrl T:打开新标签页。Ctrl W:关闭当前标签页。Ctrl Shift T:重新打开最近关闭的标签页。Ctrl Tab:在打开的标签页之间切换。Ctrl Shift Tab:在打开的标签页之间反向切换。Ctrl N:打开新窗口。Ctrl…

Kaggle实战入门:泰坦尼克号生生还预测

Kaggle实战入门:泰坦尼克号生生还预测1. 加载数据2. 特征工程3. 模型训练4. 模型部署泰坦尼克号(Titanic),又称铁达尼号,是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉&#xff…