ChatGPT-4震撼发布

news/2024/11/29 4:53:08/

3月15日消息,美国当地时间周二,人工智能研究公司OpenAI发布了其下一代大型语言模型GPT-4,这是其支持ChatGPT和新必应等应用程序的最新AI大型语言模型。该公司表示,该模型在许多专业测试中的表现超出了“人类水平”。GPT-4, 相较于ChatGPT(GPT-3.5)有了质的飞跃,这迭代速度太快了!总体来说,逻辑推理能力更强,语言能力更强,各种考试已经基本超过90%的人类!

OpenAI声称,ChatGPT-4比迭代前的GPT-3.5更大,这意味着它接受了更多的数据训练,模型文件中有更多的权重(参数),这也使得它的运行成本更高。该公司声称,该模型“比以往任何时候都更具创造性和协作性”,“可以更准确地解决难题”。它可以解析文本和图像输入,尽管它只能通过文本进行响应。

目前,该领域的许多研究人员认为,AI最近取得的许多进步来自于在数千台超级计算机上运行越来越大的模型,训练过程可能耗资数千万美元。GPT-4就是以“扩大规模”为中心以达到更好结果的例证。

OpenAI承认,该公司使用了微软云计算平台Azure来训练其模型,微软已经向OpenAI投资了数十亿美元。OpenAI以竞争为由,没有公布具体的模型大小或用于训练它的硬件等细节,这些细节可以用来重建模型。

OpenAI的GPT大型语言模型支持许多AI演示,这些演示在过去六个月里始终令科技行业的人们惊叹不已,包括必应的AI聊天机器人和ChatGPT。

ChatGPT-4是对语言模型取得最新进展的预览,这些新进展可能会在未来几周开始向下渗透到聊天机器人等消费产品中。微软周二表示,必应的AI聊天机器人使用GPT-4模型。

OpenAI声称,新模型将产生更少的事实错误答案,更少偏离话题,更少谈论被禁止的话题,甚至在许多标准化考试中表现得比人类更好。

该公司举例说,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。

然而,OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类。例如,GPT-4仍然存在所谓的“幻觉”或编造故事等问题,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)在推特上表示,GPT-4“仍然有缺陷,有很大局限性”,但“它在首次使用时仍然能给你留下深刻印象。”

OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”

OpenAI表示,该公司已经与多家公司合作以将GPT-4整合到他们的产品中,包括Duolingo、Stripe和Khan Academy等。这款新模型通过OpenAI每月20美元的ChatGPT订阅服务ChatGPT Plus向用户开放,并为微软的必应聊天机器人提供动力。同时,GPT-4也将作为API的一部分提供,该API允许程序员将AI集成到自己的应用程序中。

3月15日,微软副总裁兼消费者首席营销官Yusuf Mehdi发文确认新必应搜索引擎正在运行GPT-4。此前,OpenAI发布了多模态预训练大模型GPT-4,据介绍,GPT-4的回答准确性不仅大幅提高,还具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化。此外,GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。


http://www.ppmy.cn/news/32676.html

相关文章

chrome快捷键

Ctrl T:打开新标签页。Ctrl W:关闭当前标签页。Ctrl Shift T:重新打开最近关闭的标签页。Ctrl Tab:在打开的标签页之间切换。Ctrl Shift Tab:在打开的标签页之间反向切换。Ctrl N:打开新窗口。Ctrl…

Kaggle实战入门:泰坦尼克号生生还预测

Kaggle实战入门:泰坦尼克号生生还预测1. 加载数据2. 特征工程3. 模型训练4. 模型部署泰坦尼克号(Titanic),又称铁达尼号,是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉&#xff…

推荐一款卸载软件的小工具-《UninstallToo》

目录 UninstallToo介绍 UninstallToo下载 UninstallToo使用 总结 UninstallToo介绍 Uninstall Tool 是一款可以用来替代“添加/删除程序”的工具。它允许您显示隐藏的安装程序,按名称过滤已安装程序的列表,强行写在程序,浏览注册表项目&a…

基于Vue3和element-plus实现一个完整的登录功能

先看一下最终要实现的效果:登录页面:注册页面:(1)引入element-plus组件库引入组件库的方式有好多种,在这里我就在main.js全局引入了.npm i element-plus -Smain.js中代码:import { createApp } from "vue"; //element-plus import ElementPlus from "element-pl…

排序算法之插入排序

要考数据结构了,赶紧来复习一波排序算法 文章目录一、直接插入排序二、希尔排序一、直接插入排序 直接上主题 插排,揪出一个数,插入到原本已经有序的数组里面,如数组有n个数据,从0~n下标依次排列,先从左往…

【C++】list的使用 | 模拟实现

文章目录一、list的使用1. 构造函数2. 迭代器3. 增删查改4. 其他成员函数二、list的模拟实现1. 节点的创建2. push_back和push_front3. 普通迭代器4. const迭代器5. 增删查改(insert、erase、pop_back、pop_front)7. 构造和析构三、list模拟实现整体源码四、vector和list的区别…

Linux常用命令——基于Ubuntu22.04

本文介绍了一些Linux的常用命令。为了便于快速检索命令位置,文章二级标题都以“命令:命令的作用”展示,有些命令会先介绍命令的几个常用参数,然后结合具体的操作展示命令的使用。为了便于记忆,也会提到命令是由哪些短语…

【C++笔试强训】第三十二天

🎇C笔试强训 博客主页:一起去看日落吗分享博主的C刷题日常,大家一起学习博主的能力有限,出现错误希望大家不吝赐教分享给大家一句我很喜欢的话:夜色难免微凉,前方必有曙光 🌞。 💦&a…