GPT-4o API 全新版本发布:提升性能,增加性价比

ops/2024/9/20 7:06:25/ 标签: ai, 后端, 学习方法, AI编程, 前端
aidu_pl">

5月13日,OpenAI 发布了全新ChatGPT模型 GPT-4o,它在响应速度和多媒体理解上都有显著提升。在这篇文章中,我们将介绍 GPT-4o 的主要特点及其 API 集成方式。

什么是 GPT-4o?

GPT-4o 是 OpenAI 于5月13日发布的最新多模态 AI 模型,其中“4o”的“o”代表“omni”,意为“全能的”。与先前的 ChatGPT 不同,GPT-4o 能够处理文本、音频、图像和视频的数据交互。

GPT-4o 图片

访问官网了解更多:https://openai.com/index/hello-gpt-4o/

GPT-4o 关键功能

更快速的响应时间

OpenAI表示,GPT-4o 相较于前代模型在响应速度上有显著提升。以前的 GPT 模型在与人类对话时需要完成语音识别、文本生成和语音合成三个步骤,总延迟时间在 2.8~5.4 秒之间。而 GPT-4o 缩短了响应时间到 3.20 秒,几近实时交互。

更好的声音情感识别

以前的模型常常忽略说话者的语气和背景噪音。GPT-4o 改进了这点,它可以识别和理解音频中的情感标记,使得对话更加自然。

情感识别功能

令牌使用量减少

GPT-4o 对多种语言(包括日语)的令牌使用进行了优化。例如,一段日语对话所需的令牌数从37 减少到24。因此,语言处理变得更加高效。

令牌使用示例

免费使用基础功能

GPT-4o 发布后,原本付费的服务(如 GPT、GPT Store 和 GPT-4)均可免费使用。

提供桌面客户端

除了线上访问,现在 macOS 用户还可以通过桌面应用访问 ChatGPT,Windows 版本也将在今年下半年推出。

集成 GPT-4o API

将 GPT-4o 的功能集成到您的应用中,可以通过 API 接口非常方便地实现。那么如何使用 GPT-4o API 呢?

GPT-4o API 使用方法

根据 OpenAI 提供的信息,GPT-4o API 可以通过 Chat Completions API、Assistants API 和 Batch API 使用,支持文本和视觉数据的多模态输入。

GPT-4o API 特性

与旧版 API 相比,GPT-4o API 在以下几个方面有了改进:

  • 更智能:在文本分析、推理和编程上有显著提升。
  • 响应更快:响应速度是 GPT-4 Turbo 的两倍。
  • 价格更低:输入和输出的费用比 GPT-4 Turbo 减少了一半。
  • 速率限制提升:与 GPT-4 Turbo 相比,速率限制提高了五倍。
  • 增强的视觉处理能力:优化了视觉处理。
  • 更好的非英语语言处理:在处理非英语语言文本时更为高效。

GPT-4o API 定价

根据 OpenAI API 定价页面的信息,GPT-4o 文本输入和输出的成本为:

  • 输入:5美元 / 百万 Tokens
  • 输出:15美元 / 百万 Tokens

视觉处理的费用根据图像宽度和高度计算。

定价示例

使用 JPEG-4o API 时的注意事项

使用或从旧版本切换到 GPT-4o API 时,请注意以下几点:

  1. GPT-4o API 支持通过感知能力理解不含音频的视频,需要将视频转换成帧输入模型。
  2. 截至 2024年5月14日,GPT-4o 不支持音频模式。
  3. GPT-4o 不支持图像生成功能,建议继续使用 DALL-E 3 API。
  4. OpenAI 建议目前使用 GPT-4 或 GPT-4 Turbo 的用户尝试 GPT-4o,评估其表现是否更优。

管理您的 API

GPT-4o API 的调试和管理至关重要。下面是 APIHub 中的 OpenAI 的接口文档。

Apifox

获取和使用 OpenAI API 密钥

要开始使用 GPT-4o API,你需要获取 OpenAI API 密钥。步骤如下:

1. 创建 OpenAI 账户

首先访问 OpenAI 官网并创建一个新账户。

OpenAI 账户

2. 获取 API 密钥

登录账户后,访问 API 密钥页面并点击“Create new secret key”生成新的密钥。

生成 API 密钥

记录并安全存储你的 API 密钥,因为生成后无法再次查看。

测试和管理 GPT-4o API

Apifox 是测试和管理 GPT-4o API 的理想工具。它提供了一个 OpenAI API 项目,涵盖所有 OpenAI 提供的 API。

OpanAI 项目

选择左侧菜单中的每一项,开始使用 GPT-4o API。

API 管理

实战:将 GPT-4o API 与 Apifox 结合使用

访问 Apifox 上的 OpenAI API 项目,选择 Chat Completions API。根据 ChatGPT 规范,输入 HTTP 方法和端点 URL。

在“Body”选项卡中以 JSON 格式输入 ChatGPT 消息,将 "model":"gpt-4o" 包含在内。

输入开发

在“Headers”选项卡中添加授权参数,输入你的 ChatGPT API 密钥,然后点击“发送”按钮。

Headers设定

你可以在 Apifox 中将 OpenAI 的 API 密钥设置为环境变量,以简化后续操作。

环境变量

总结

本文介绍了 OpenAI 新推出的 GPT-4o 模型及其 API 集成方式:

  • 速度更快
  • 支持更多类型的输入
  • 令牌使用量减少
  • 更高性价比的 API 费用
  • 改进的视觉和非英语文本处理能力

http://www.ppmy.cn/ops/41473.html

相关文章

软件3班20240513

java.util.PropertyResourceBundle4554617c package com.yanyu;import java.sql.*; import java.util.ResourceBundle;public class JDBCTest01 {public static void main(String[] args) throws SQLException { // 获取属性配置文件ResourceBundle bundle Res…

SpringMVC 注解详解

SpringMVC 注解详解 1. 引言 SpringMVC 是 Spring 框架中的 Web 层解决方案,它通过注解的方式来简化 MVC 模式的实现。本篇将详细介绍 SpringMVC 中常用的注解及其用法。 2. SpringMVC 注解分类 SpringMVC 的注解主要分为以下几类: 2.1 核心注解 C…

qt 麒麟系统 connot find /usr/local/lib

目录 解决方法: 后来又报错: cannot find -lopencv_world3.4.6 connot find /usr/local/lib 解决方法: LIBS -L/usr/local/lib -lopencv_world3.4.6QMAKE_LFLAGS -Wl,-rpath,/usr/local/lib 后来又报错: cannot find -lopencv…

软件测试面试78问

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 1、问:你在测试中发现了一个bug,但是开发经理认为这不是一个bug&#xf…

Pycharm所有快捷键的使用

1.编辑 快捷键作用Ctrl Space基本的代码完成(类、方法、属性)Ctrl Alt Space快速导入任意类Ctrl Shift Enter语句完成Ctrl P参数信息(在方法中调用参数)Ctrl Q快速查看文档Shift F1外部文档Ctrl 鼠标简介Ctrl F1显示错…

从零开始详解OpenCV条形码区域分割

前言 在识别二维码之前,首先要划分出二维码的区域,在本篇文章中将从零开始实现二维码分割的功能,并详细介绍用到的方法。 我们需要处理的图像如下: 完整代码 首先我们先放出完整代码,然后根据整个分割流程介绍用到…

[自动化]pyautogui的使用

目录 环境 包的版本 前置知识 鼠标控制函数 屏幕与鼠标位置 size() position() OnScreen() 鼠标移动 moveTo() move() 鼠标拖动 dragTo() drag() mouseDown()按下鼠标 mouseUp()松开鼠标 鼠标滚动 scroll() 键盘控制函数 write() press() keyDown()和keyU…

wireshark_概念

ARP (Address Resolution Protocol)协议,即地址解析协议。该协议的功能就是将IP地址解析成MAC地址。 混杂模式 抓取经过网卡的所有数据包,包括发往本网卡和非发往本网卡的。 非混杂模式 只抓取目标地址是本网卡的数据包,对于发往…

前端 JS 经典:CommonJs 规范

1. Node 环境介绍 CommonJs 简称 CMJ,CMJ 的模块标准,必须在 node 的环境中才支持。在浏览器中用,是不行的。 查看电脑是否安装 node,通过打开终端,运行 node -v 查看是否返回 node 版本。返回则已安装。 CMJ 在 no…

数据结构之----树

树 结点拥有的子树数量称为结点的度 树中结点的最大层次称为树的深度或高度 如果将树中结点的各子树看成从左至右是有次序的,不能互换的,则称该树为有序树,否则称无序树 森林是m棵互不相交的树的集合 树的存储结构 1,双亲表示法…

【JVM】调优工具

这里简单介绍一下各种调优用到的工具 一,环境准备 首先我们需要准备好Java环境,和win上的jdk环境(图形化界面如jconsole只有jdk中有)。 有这样一个类Prolem,每个线程都会带来100个垃圾对象,线程new完100…

用Rust打印杨辉三角

一、杨辉三角是什么? 杨辉三角是一个著名的数学图形,它展示了二项式系数的排列方式。 杨辉三角是一种将二项式系数以三角形阵列排列的数学图形,具有丰富的历史和数学意义。 杨辉三角的历史起源可以追溯到中国南宋时期,由数学家杨辉…

leetcode刷题——设计循环链表

题目要求我们设计循环队列,其特点是容量固定,队列循环,如图所示: 这里的队列我们以链表队列举例,对于循环,只需要把尾节点的指针指向头节点。重点是队列的容量固定:如何确定队列是否已满和空&am…

Kaggle赛题总结:Enefit - Predict Energy Behavior of Prosumers

文章目录 比赛介绍赛题任务评估指标数据集描述优胜方案第1名第6名第7名第10名第13名内容分享冠军tricktrick应用获胜方案里对trick的应用模型特征工程在线学习小结

AI视频教程下载:用ChatGPT制作 YouTube视频的指南

课程大纲: 面向 YouTuber 的 ChatGPT YouTube关键词研究 YouTube标题 YouTube缩略图 YouTube社区帖子 组织您的 YouTube 视频 本课程将通过两个不同领域的YouTube视频,展示如何使用Chat GPT来创建关键词、标题、缩略图、描述和社区帖子。 关键词研…

C++中调用python函数(VS2017+WIN10+Anaconda虚拟环境)

1.利用VS创建C空项目 step1 文件——新建——项目 step2 Visual C—— Windows桌面——Windows桌面向导 step3 选择空项目 step4 源文件——新建项——添加 step5 Visual C——C文件(.cpp) 2.配置环境 Step1. 更换成Release与X64 Step2. 打开项目属性&…

react18封装公共请求函数

如果里面要处理比如token过期,跳转登录这种情况的话,官方又说组件外不允许使用Hooks函数,这里可以这样做 使用redux 并新建一个store/index.ts import { configureStore, combineReducers } from reduxjs/toolkit import counterRouter fro…

Spring Boot进阶 - Starter原理

Spring Boot Starter的原理主要是为了简化Spring应用的配置和初始化过程,让开发者能够快速启动并运行应用,而不需要手动配置大量的XML或Java配置类。下面是Spring Boot Starter的核心工作原理: 自动配置(Auto-Configuration&#…

Facebook国内企业三不限白名单户/二不限/BM户

哈喽呀,今天是来给大家分享一下Facebook国内三不限白名单户/二不限/BM户都是啥? Facebook作为全球最大的社交媒体,同时也是各大跨境电商企业选择作为推广广告的平台,Facebook为了满足各大企业的需求,提供…

线性回归模型的解释及应用场景

线性回归模型是一种数学和统计方法,用于确定两种或两种以上变量之间的定量关系。下面是对线性回归模型的详解及其应用场景的说明。 一、线性回归模型详解 线性回归模型是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种…