OpenAI推出新模型GPT-4o:可实时交互,检测人的情绪,支持多模态输出

embedded/2024/10/3 21:08:20/

GPT-4o作为OpenAI新发布的人工智能模型,据官方及媒体报道,是面向全球用户发布的,包括中国在内的用户理论上应该能够通过相应平台和应用访问。不过,实际可用性还需考虑地区政策、网络访问限制以及具体平台是否在中国有本地化服务等因素。用户需要关注OpenAI或相关合作平台的正式公告,以获取在中国使用GPT-4o的具体方式和限制。

GPT-4o(“o”代表“omni”)。它可以实现文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。

在GPT-4o之前,使用语音模式与ChatGPT交谈,平均延迟为2.8秒 (GPT-3.5) 和5.4 秒 (GPT-4)。为了实现这一点,语音模式是一个由三个独立模型组成的管道:一个简单的模型将音频转录为文本,GPT-3.5或GPT-4接收文本并输出文本,第三个简单模型将该文本转换回音频。这个过程意味着GPT-4会丢失大量信息——它无法直接观察音调、多个扬声器或背景噪音,也无法输出笑声、歌声或表达情感。

更多可参考: ChatGPT Plus使用指南

此外还具有以下几个显著特点和优势:

1.多模态能力:GPT-40的大突破在于其原生的多模态特性能够接收和处理文本、音频冬像等不同形式的输入,并输出多种形式的内容,这是以前的模型难以比拟的。这种能力极大地扩展了AI的应用范围,使交互更加自然和全面。

2.高性能与低成本:报道指出GPT-4o相比前代模型在推理速度上有了显著提升,同时成本降低,这对于商业应用和个人用户都是极为有利的,意味着更高效、更经济的AI解决方案。

3.易用性提升:GPT-40增强了易用性,不仅支持50多种语言,而且在文本、视频和音频处理方面都有所改进,为全球用户提供更广泛的服务覆盖和更好的用户体验。

4.情感与交互:新模型在语音对话方面的优化使得交互响应速度更快,更加流畅,接近人类水平,这在提升用户满意度和沉浸感方面迈出了重要一步。

5.创新应用潜力:GPT-40的推出,为开发者打开了新的大门,尤其是在数据分析、图像分析互联网搜索、应用开发等领域,有望催生一系列创新应用和服务。

借助GPT-4o,OpenAI在文本、视觉和音频上端到端地训练了一个新模型,这意味着所有输入和输出都由同一个神经网络处理。

按照传统基准测试,GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉能力方面创下了新的高水位线。

基于GPT-4o的能力,新的ChatGPT不仅可以实现实时交互,还能检测人的情绪,支持多模态输出。

在现场,OpenAI的工程师展示新模型的能力时说:“我第一次来直播的发布会,有点紧张。”

ChatGPT说:“要不你深呼吸一下。”

OpenAI工程师深呼吸后,ChatGPT立即说:“你这不行,喘得也太大了。”

视觉能力上,ChatGPT不需要上传图片,而是直接打开摄像头,实时看发生了什么。

OpenAI的人直接开始现场写方程,所有的一切ChatGPT都看在眼里,OpenAI的人一边写,ChatGPT一遍给答案。


甚至,用户可以直接跟ChatGPT视频对话,ChatGPT可以看到用户所有的表情和情绪变化。

GPT-4o的文本和图像功能今天开始在ChatGPT中推出。GPT-4o在免费套餐中提供,并向Plus用户提供高达5倍的消息限制。在未来几周内,ChatGPT Plus将推出带有GPT-4o的新版本语音模式。


http://www.ppmy.cn/embedded/41363.html

相关文章

蓝桥杯第2357题——限高杆(多层图+dijkstra)

问题描述 某市有 𝑛 个路口, 有 𝑚 段道路连接这些路口, 组成了该市的公路系统。其 中一段道路两端一定连接两个不同的路口。道路中间不会穿过路口。 由于各种原因, 在一部分道路的中间设置了一些限高杆, 有限高杆的路段 货车无法通过。 在该市有两个…

【C++风云录】探索食品工艺的新工具:创新你的食谱

食品加工模拟:优化你的营养研究 前言 在科技的推动下,食品科学领域已经逐步引入了智能化工具,以协助研究人员和工业界进行更精细、更深入的研究。本文将详细介绍六款与食品科学紧密相关的软件和库,它们包括FoodCAD, Nutritional…

[MRCTF2020]PixelShooter

是个安卓游戏题 re手肯定不会去玩游戏,先jadx分析一波 没有什么关键信息,但找到了一个unity类,想到apk也可以解压缩得到 .so 或者 Assembly-CSharp.dll 故又在dnspy分析一下 看了半天没有和flag有关信息,看wp: Asse…

计算机网络实验1:交换机基本配置管理

实验目的和要求 安装Packer Tracer,了解Packer Tracer的基本操作掌握交换机基本命令集实验项目内容 认识Packet Tracer软件 交换机的基本配置与管理 交换机的端口配置与管理 交换机的端口聚合配置 交换机划分Vlan配置 实验环境 硬件:PC机&#x…

什么?免费使用GPT-4o?

⭐简单说两句⭐ ✨ 正在努力的小叮当~ 💖 超级爱分享,分享各种有趣干货! 👩‍💻 提供:模拟面试 | 简历诊断 | 独家简历模板 🌈 感谢关注,关注了你就是我的超级粉丝啦! &a…

上海人工智能实验室浦视团队联培博士(2025)招生正式启动!

上海人工智能实验室浦视团队2025级联培博士招生计划开启啦! 上海人工智能实验室作为国内领先的人工智能领域的新型科研机构,不仅致力于攻克重要基础理论难题,更着眼于构建全球领先的 AI 技术人才培养平台。浦视团队是大模型方向的核心科研团…

深入理解 `@TableId(type = IdType.AUTO)`:使用方法及其与其他主键生成策略的区别

在使用 MyBatis-Plus 进行数据库操作时,主键生成策略是一个重要的概念。MyBatis-Plus 提供了多种主键生成策略,通过注解 TableId 来配置,其中 IdType.AUTO 是最常用的一种。本文将详细介绍 TableId(type IdType.AUTO) 的使用方法&#xff0c…

python中几种推导式简单样例

目录 一、python中几种推导式 1.1 列表推导式: 1.2 字典推导式 1.3 生成器表达式: 1.4 条件表达式: 二、简化对多个列表的并行迭代函数: 一、python中几种推导式 1.1 列表推导式: 使用列表推导式可以简化对列表…