OpenAI直播发布第6天:ChatGPT视频聊天、屏幕共享和圣诞语音包!

ops/2024/12/19 2:37:23/

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

今天是OpenAI连续12天直播发布会的第6天

本系列将在每个工作日持续更新,为小伙伴们带来第一手的更新解读,敬请关注。

Day 6 发布内容

“鸽”了214天的ChatGPT视频聊天功能,今天它来了!

视频聊天是ChatGPT高级语音模式(Advanced Voice Mode)中的核心功能之一,最早亮相于今年5月13日的春季直播发布会上,与之同时发布的还有GPT-4o模型。近4个月后的9月24日,OpenAI表示高级语音模式已经测试结束,开始正式推送。但当时发布的还不是高级语音的完整版本,只有语音聊天的功能,缺少了视觉相关的功能,如视频和屏幕共享。

关于高级语音模式(Advanced Voice Mode)是什么,感兴趣的小伙伴按需食用。

视频聊天

最新的高级语音模式在app页面会出现一个视频聊天的图标,点击后可进入视频聊天模式。

和微信视频聊天一样,只不过对方是ChatGPT,能够通过摄像头获取到环境内容,使得对话更加丰富实用。

高级语音模式(Advanced Voice Mode)由原生的多模态GPT-4o模型提供支持,能够进行端到端的语音和视频通话,即直接接收、理解和输出音频,并支持超过50种语言(这一点比当前的Gemini实时语音强一些),提供更自然、富有情感的对话体验。

和AI实时视频聊天的功能在工作、生活、学习中都很实用,比如今天demo中展示的在ChatGPT实时指导下制作手冲咖啡。ChatGPT能够识别出桌子上的器具并逐步指导,并且在整个过程中,ChatGPT能够提供实时观察和反馈,确保每一步操作都正确无误。

屏幕共享

除了正常的视频聊天,ChatGPT高级语音模式还支持拍照、上传照片和屏幕共享功能。入口在高级语音页面的下方三个点图标处,点击后选择即可。

共享屏幕后,ChatGPT能主动读取和理解当前页面的内容,这个功能非常适合让ChatGPT分析页面内容,比如短信和邮件。相当于有了一个实时的AI助手,可以对话,并且还能实时获取页面内容。

圣诞模式

ChatGPT专门针对圣诞节推出了圣诞模式

聊天框右侧的雪花图标即是圣诞模式的入口,点击后即可与圣诞老人进行对话,圣诞老人将使用他标志性的欢快声音实时回应。

值得注意的是,圣诞模式属于“限时”功能,仅在今天到12月底前可用。

如何与ChatGPT视频聊天?

OpenAI官方表示,高级语音模式的视频、屏幕共享以及图片上传功能正在逐步向ChatGPT Pro、Plus、Team付费用户灰度推送,预计在未来几天内完成。

如何辨别是否已经被推送到这些新功能?

很简单,进入ChatGPT高级语音模式后,如果能在左下角看到下面这个视频聊天的图标,就说明已经开启了视频功能。点击这个按钮,即可开始和ChatGPT视频聊天。

完整版的高级语音功能仅向付费用户开放,免费用户可试用一小段时长。

Day 6 完整版直播视频

OpenAI 12天直播发布回顾

OpenAI于12月5日开启“12天发布季”,本系列将在每个工作日持续更新,为小伙伴们带来第一手的更新解读,敬请关注。

日期发布关键词详细解读文章
🌟 Day 1满血版 o1ChatGPT Pro 新套餐
✨ Day 2强化学习微调(Reinforcement Fine-Tuning, RFT)
🎥 Day 3文生视频模型 Sora
🖌️ Day 4ChatGPT Canvas
🍎 Day 5Apple Intelligence

结语

当ChatGPT有了视觉能力,它将成为一个更合格的AI助手。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。


http://www.ppmy.cn/ops/143053.html

相关文章

社交电商新风口:短视频交友+自营商城源码运营

创新运营中,将短视频交友与自营商城源码融合,确实是一个引领潮流的举措。这种融合不仅为用户提供了一个既能交友互动又能购物的综合性平台,还通过丰富的功能和先进的技术手段,提升了用户体验,增加了用户粘性。以下是对…

Ubuntu环境中安装docker

安装依赖sudo apt update sudo apt install apt-transport-https ca-certificates curl gnupg lsb-release添加阿里云GPG秘钥curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -设置stable仓库sudo add-apt-repository "deb [archamd…

C++打地鼠游戏一小时极限开发

视频:【课设拯救计划/直播回放】C打地鼠游戏一小时极限开发(完整版)_哔哩哔哩_bilibili 创建几个全局变量: IMAGE img_menuBackground; //主菜单背景图 IMAGE img_mole; //地鼠图片 IMAGE img_empty; //坑位图片 IMAGE im…

MR30分布式 IO 模块:硅晶行业电池片导片机的智能 “心脏”

硅晶产业作为全球能源和电子领域的基石,其生产规模庞大且工艺复杂。从硅料的提纯、拉晶,到硅片的切割、电池片的制造,每一个环节都要求高精度与高稳定性。在电池片生产环节,导片机承担着硅片传输与定位的重要任务,其运…

短波红外相机

短波红外相机搭载采用 SenSWIR 技术的 Sony 高灵敏度传感器,能捕获到400nm~1700nm范围的可见光-短波红外宽波段图像信息,该相机可替代传统的“可见光相机短波红外相机”双相机检测方案,降低系统成本、提高处理速度、扩大检测范围,…

opencv Canny边缘检测

canny阈值越高,检测到的边缘数量越少 # 导入OpenCV库,用于图像处理 import cv2 import numpy as np # 从matplotlib库中导入pyplot模块,用于绘制图像 from matplotlib import pyplot as plt # 创建一个名为window的窗口,窗口大小自…

Web 毕设篇-适合小白、初级入门练手的 Spring Boot Web 毕业设计项目:教室信息管理系统(前后端源码 + 数据库 sql 脚本)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 1.0 项目介绍 开发工具:IDEA、VScode 服务器:Tomcat, JDK 17 项目构建:maven 数据库:mysql 8.0 系统用户前台和管理…

Linux应用开发————mysql数据库表

mysql数据库表操作 查看表的结构 mysql> desc / describe 表名; 或者: mysql> show create table 表名; 常见数据库引擎: innodb, myISAM... 删除表 mysql> drop tabl…