GPT-4o API 全新版本发布：提升性能，增加性价比

aidu_pl">

5月13日，OpenAI 发布了全新ChatGPT模型 GPT-4o，它在响应速度和多媒体理解上都有显著提升。在这篇文章中，我们将介绍 GPT-4o 的主要特点及其 API 集成方式。

什么是 GPT-4o？

GPT-4o 是 OpenAI 于5月13日发布的最新多模态 AI 模型，其中“4o”的“o”代表“omni”，意为“全能的”。与先前的 ChatGPT 不同，GPT-4o 能够处理文本、音频、图像和视频的数据交互。

GPT-4o 图片

访问官网了解更多：https://openai.com/index/hello-gpt-4o/

GPT-4o 关键功能

更快速的响应时间

OpenAI表示，GPT-4o 相较于前代模型在响应速度上有显著提升。以前的 GPT 模型在与人类对话时需要完成语音识别、文本生成和语音合成三个步骤，总延迟时间在 2.8~5.4 秒之间。而 GPT-4o 缩短了响应时间到 3.20 秒，几近实时交互。

更好的声音情感识别

以前的模型常常忽略说话者的语气和背景噪音。GPT-4o 改进了这点，它可以识别和理解音频中的情感标记，使得对话更加自然。

情感识别功能

令牌使用量减少

GPT-4o 对多种语言（包括日语）的令牌使用进行了优化。例如，一段日语对话所需的令牌数从37 减少到24。因此，语言处理变得更加高效。

令牌使用示例

免费使用基础功能

GPT-4o 发布后，原本付费的服务（如 GPT、GPT Store 和 GPT-4）均可免费使用。

提供桌面客户端

除了线上访问，现在 macOS 用户还可以通过桌面应用访问 ChatGPT，Windows 版本也将在今年下半年推出。

集成 GPT-4o API

将 GPT-4o 的功能集成到您的应用中，可以通过 API 接口非常方便地实现。那么如何使用 GPT-4o API 呢？

GPT-4o API 使用方法

根据 OpenAI 提供的信息，GPT-4o API 可以通过 Chat Completions API、Assistants API 和 Batch API 使用，支持文本和视觉数据的多模态输入。

GPT-4o API 特性

与旧版 API 相比，GPT-4o API 在以下几个方面有了改进：

更智能：在文本分析、推理和编程上有显著提升。
响应更快：响应速度是 GPT-4 Turbo 的两倍。
价格更低：输入和输出的费用比 GPT-4 Turbo 减少了一半。
速率限制提升：与 GPT-4 Turbo 相比，速率限制提高了五倍。
增强的视觉处理能力：优化了视觉处理。
更好的非英语语言处理：在处理非英语语言文本时更为高效。

GPT-4o API 定价

根据 OpenAI API 定价页面的信息，GPT-4o 文本输入和输出的成本为：

输入：5美元 / 百万 Tokens
输出：15美元 / 百万 Tokens

视觉处理的费用根据图像宽度和高度计算。

定价示例

使用 JPEG-4o API 时的注意事项

使用或从旧版本切换到 GPT-4o API 时，请注意以下几点：

GPT-4o API 支持通过感知能力理解不含音频的视频，需要将视频转换成帧输入模型。
截至 2024年5月14日，GPT-4o 不支持音频模式。
GPT-4o 不支持图像生成功能，建议继续使用 DALL-E 3 API。
OpenAI 建议目前使用 GPT-4 或 GPT-4 Turbo 的用户尝试 GPT-4o，评估其表现是否更优。

管理您的 API

GPT-4o API 的调试和管理至关重要。下面是 APIHub 中的 OpenAI 的接口文档。

Apifox

获取和使用 OpenAI API 密钥

要开始使用 GPT-4o API，你需要获取 OpenAI API 密钥。步骤如下：

1. 创建 OpenAI 账户

首先访问 OpenAI 官网并创建一个新账户。

OpenAI 账户

2. 获取 API 密钥

登录账户后，访问 API 密钥页面并点击“Create new secret key”生成新的密钥。

生成 API 密钥

记录并安全存储你的 API 密钥，因为生成后无法再次查看。

测试和管理 GPT-4o API

Apifox 是测试和管理 GPT-4o API 的理想工具。它提供了一个 OpenAI API 项目，涵盖所有 OpenAI 提供的 API。

OpanAI 项目

选择左侧菜单中的每一项，开始使用 GPT-4o API。

API 管理

实战：将 GPT-4o API 与 Apifox 结合使用

访问 Apifox 上的 OpenAI API 项目，选择 Chat Completions API。根据 ChatGPT 规范，输入 HTTP 方法和端点 URL。

在“Body”选项卡中以 JSON 格式输入 ChatGPT 消息，将 "model":"gpt-4o" 包含在内。

输入开发

在“Headers”选项卡中添加授权参数，输入你的 ChatGPT API 密钥，然后点击“发送”按钮。

Headers设定

你可以在 Apifox 中将 OpenAI 的 API 密钥设置为环境变量，以简化后续操作。

环境变量

总结

本文介绍了 OpenAI 新推出的 GPT-4o 模型及其 API 集成方式：

速度更快
支持更多类型的输入
令牌使用量减少
更高性价比的 API 费用
改进的视觉和非英语文本处理能力