GPT-4发布:多模态大模型,AI能力再度进化,可识别图像内容

news/2024/11/15 8:27:13/

能终结chatGPT的人只有openAI自己。 ——阿卡夫斯基-作者本人
:::

今日凌晨,OpenAI发布了GPT的最新一代版本ChatGPT-4,相比3.5,其AI能力再度进化,同时支持输入的内容不再仅限于文字,而且支持图像内容的输入,成为一个能够理解照片的人工智能。

GPT-4 实现了以下几个方面的飞跃式提升:

  1. 强大的识图能力
  2. 文字输入限制提升至 2.5 万字
  3. 回答准确性显著提高
  4. 能够生成歌词、创意文本,实现风格变化

比如这张图,你问他这张图内容有什么不一样的地方

他会回答你:这张图的不通寻常之处在于,一个男人正在一辆行驶中的出租车车顶上的熨衣板上熨衣服

再比如这张图,你问他为什么这很可笑?


他会回答你:这幅图的幽默之处在于,把一个大而过时的VGA接口接入一个小而现代的智能手机充电接口

值得一提的是,除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点

OpenAI称,公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果,“至少对我们而言,GPT-4训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”

未来,也许ChatGPT不仅仅是支持图像的输入,可能支持视频的输出


OpenAI让GPT-4在参加了许多项人类的通用考试

结果证明,它在许多测试和基准测试中的表现比前一代确实大大提高:根据他们的测试结果,GPT-4的SAT分数增加了150分,现在能拿到1600分中的1410分;它能通过模拟律师考试,分数在应试者的前10%左右,相比之下,GPT-3.5的得分在倒数 10% 左右

chatgp4考试成绩超过九成人类

在SAT阅读考试中和SAT数学考试中,GPT-4的成绩都能达到领先的排名……


“它并不完美,但你也一样”

OpenAI官方表示,GPT-4由于其广泛的通用知识和解决问题的能力,可以更准确地解决难题。

GPT-4比以往任何时候都更具创造力和协作性。它可以生成、编辑和迭代用户的创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。

GPT-4在高级推理能力上超越ChatGPT。在律师模拟考试中,ChatGPT背后的GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。

此外,GPT-4的长度限制提升到32K tokens,即能处理超过25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。

OpenAI还贴心地发布了GPT-4开发者视频,手把手教你生成代码、检查错误信息、报税。OpenAI联合创始人兼总裁布罗克曼(Greg Brockman)还说了句有点扎心的话:“它并不完美,但你也一样。”

目前仅向ChatGPT Plus付费用户开放

与免费的ChatGPT不同,GPT-4目前仅向ChatGPT Plus的付费用户开放,它也将作为API(应用程序编程接口)提供给企业及开发者,开发者需进入等候名单上,将该模型集成到他们的应用程序中。

OpenAI开源了Evals框架,以自动评估AI模型性能,允许用户报告模型中的缺点,帮助其改进。OpenAI工程师在介绍说,“GPT-4 是世界第一款高体验,强能力的先进AI系统,我们希望很快把它推向所有人。”

不过,GPT-4仍然不是完全可靠的,比如会对事实产生“幻觉”,并出现推理错误。OpenAI提醒,在使用语言模型的输出时,特别是在高风险的情况下,应该非常小心谨慎。

以上就是今天关于GPT-4的介绍,不知道文心一言出来后会如何,不管怎样,迫不及待的用户大概已经开始测试体验了吧。


http://www.ppmy.cn/news/969934.html

相关文章

GPT-4正式发布!如何访问 怎么免费使用GPT-4?

美国人工智能研究实验室OpenAI,周二为其爆红聊天机器人ChatGPT发布了最新GPT-4语言模型,这距离ChatGPT的上线仅仅过去了4个月时间。 和ChatGPT最初使用的GPT-3.5模型相比,GPT-4实现了几个方面的飞跃式提升:强大的识图能力&#x…

ChatGPT-5传闻将于2023年底推出,它会实现AGI吗?

人工智能研究实验室OpenAI最近因发布其大型语言模型 (LLM) 的最新版本ChatGPT-4而成为头条新闻。然而,关于 ChatGPT-5 开发的报道已经浮出水面,有传言称 OpenAI 预计将在 2023 年底完成培训。 由于 OpenAI 尚未公开讨论该项目,因此围绕GPT-5 …

GPT-4炸圈--多模态大模型

前言 在chatGPT如火如荼的时候,OpenAI又上演了王者归来的戏码,重磅发布了GPT-4。GPT-4是作为“帮你写代码”和你“肆意聊天”的chatGPT的基础模型GPT-3的升级版,是一个新的里程碑。 GPT-4 是一个大型多模态模型,虽然很多能力还不…

ChatGPT-4:恐怖的AI再度进化,可识别图像内容

近日,OpenAI公司发布了一款新的AI技术——ChatGPT-4,它是一种基于自然语言处理的深度学习模型,可以识别图像内容并生成相应的文字描述。ChatGPT-4的发布,标志着人工智能技术再度进化,令人恐惧。 ChatGPT-4是OpenAI公…

竞品还在追赶 OpenAI用GPT-4飚赢自己

赶在百度“文心一言”发布前一天,OpenAI祭出了GPT-4,这对于百度、谷歌们来说,可能是一个重大打击。 人们已经领略过GPT-3.5加持下的ChatGPT,但GPT-4比“前辈”更强大,它具有更高的可靠性和准确性,能够读懂…

GPT-4来炸场:10秒输出一个网站,识图知意 so easy,为何如此丝滑

比被卷更可怕的莫过于自己卷自己,这点还得是OpenAI更胜一筹。 四个月前,ChatGPT 刚刚推出,并成为历史上增长最快的消费者应用程序。在ChatGpt大杀四方时,万众瞩目的大型多模态模型GPT-4也在今天凌晨正式发布。 据OpenAI官方介绍&…

chatgpt赋能python:Python如何查看图片

Python如何查看图片 在SEO优化中,图片也是至关重要的一部分。而在Python中,我们可以使用一些代码来查看图片。下面就来介绍一下Python如何查看图片的方法。 1. 安装Python相关库 要使用Python查看图片,需要先安装一些相关的库。常用的库包…

ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源

来源 | APPSO 上周,OpenAI 的 CEO Sam Altman 和 AI 开发平台 HumanLoop 的创始人Raza Habib 等 20 多位开发者开展了一次闭门讨论会,主要聊了 OpenAI 的使命、AI 的影响以及一些在开发过程中的实际问题。 会后 Raza Habib 做了一份详细的会议要点整理&a…