OpenAI推出o3-mini推理模型,首次免费开放,性能超越o1,AIME测试准确率高达87.3%

news/2025/2/3 3:13:30/

OpenAI在2025年初推出了一款新的推理模型o3-mini,这款模型标志着公司在提升性能的同时也降低了成本,并且首次向免费用户提供访问权限。o3-mini是OpenAI推理系列中最新、最具成本效益的模型,在科学、数学、编程等领域的性能显著超越了之前的o1模型。

o3-mini模型在多个关键指标上表现出色。例如,在2024年美国数学邀请赛(AIME 2024)测试中,当设置为高推理强度时,其准确率达到了87.3%,这一成绩不仅超过了前代产品o1-mini,而且在处理复杂问题时展现出了卓越的推理能力。此外,o3-mini在其他领域如博士级科学问题(GPQA Diamond)、编程竞赛(Codeforces)和软件工程测试(SWE-bench Verified)中也显示出了明显的优势。

该模型支持三种不同的推理强度:低、中、高,用户可以根据具体需求调整模型的“思考努力程度”,以平衡速度与准确性。在中等推理强度下,o3-mini的表现与o1模型相当,但在响应速度上却快了24%,平均响应时间为7.7秒。这意味着开发者可以在不牺牲性能的前提下获得更快的结果,提高了工作效率。

对于付费用户而言,o3-mini提供了更多的灵活性。ChatGPT Plus、Team和Pro用户可以使用不同级别的o3-mini,包括更高智能的版本o3-mini-high。这些用户还将享受更高的流量限制,比如Plus和Teams用户的每日消息限制从原先的50条增加到了150条,而每月支付200美元的Pro用户则没有流量限制。

值得注意的是,虽然o3-mini在性能上有所提升,但它的价格相较于市场上的一些竞争对手仍然较高。例如,DeepSeek-R1模型的价格明显低于o3-mini,尽管如此,o3-mini在某些特定任务上的表现依然具有竞争力。这也反映了当前AI市场中的竞争态势,即一方面追求技术领先,另一方面也在探索如何降低成本以吸引更多用户。

o3-mini的发布不仅是对技术进步的一种体现,也是对市场需求变化的积极响应。通过提供免费试用版,OpenAI旨在吸引更广泛的用户群体尝试其最新的推理技术。同时,这也可能是为了应对来自像DeepSeek这样的新兴公司的挑战,后者以其性价比高的产品获得了市场的关注。

总的来说,o3-mini代表了OpenAI在优化AI推理模型方面取得的新进展,它不仅提高了效率和准确性,还通过灵活的定价策略和免费试用来扩大用户基础。这对于学术界和工业界的用户来说都是一个好消息,因为它意味着他们可以用更低的成本获得更强的计算能力和更好的用户体验。随着技术的不断迭代,我们可以期待未来会有更多创新的产品和服务出现,进一步推动AI领域的发展。


http://www.ppmy.cn/news/1568851.html

相关文章

计算机网络 笔记 传输层

概述: 主要功能: TCP: 特点***: 数据格式: 连接管理***: 建立连接(三次握手) 释放连接(四次挥手) 应用场景 UDP: 特点: 数…

手写call函数、手写apply函数、手写bind函数

文章目录 1 手写call函数2 手写apply函数3 手写bind函数 1 手写call函数 call函数的实现步骤: 判断调用对象是否为函数。判断传入上下文对象是否存在,如果不存在,则设置为window。处理传入的参数,截取第一个参数后的所有参数。将…

记录一次Sqoop从MySQL导入数据到Hive问题的排查经过

个人博客地址:记录一次Sqoop从MySQL导入数据到Hive问题的排查经过 | 一张假钞的真实世界 问题描述 MySQL中原始数据有790W+的记录数,在Sqoop抽取作业成功的情况下在Hive中只有500W左右的记录数。 排查过程 数据导入脚本Log 通过Log可以发现以下信息: 该Sqoop任务被分解…

嵌入式硬件篇---基本组合逻辑电路

文章目录 前言基本逻辑门电路1.与门(AND Gate)2.或门(OR Gate)3.非门(NOT Gate)4.与非门(NAND Gate)5.或非门(NOR Gate)6.异或门(XOR Gate&#x…

高性能消息队列Disruptor

定义一个事件模型 之后创建一个java类来使用这个数据模型。 /* <h1>事件模型工程类&#xff0c;用于生产事件消息</h1> */ no usages public class EventMessageFactory implements EventFactory<EventMessage> { Overridepublic EventMessage newInstance(…

全志 视频输入组件的使用

1.启动MPP和Glog库 示例代码&#xff1a; log_init(argv[0], &stGLogConfig);MPP_SYS_CONF_S stSysConf; memset(&stSysConf, 0, sizeof(MPP_SYS_CONF_S)); stSysConf.nAlignWidth 32; AW_MPI_SYS_SetConf(&stSysConf); ret AW_MPI_SYS_Init();2.获取配置文件信…

物联网 STM32【源代码形式-使用以太网】连接OneNet IOT从云产品开发到底层MQTT实现,APP控制 【保姆级零基础搭建】

物联网&#xff08;IoT&#xff09;‌是指通过各种信息传感器、射频识别技术、全球定位系统、红外感应器等装置与技术&#xff0c;实时采集并连接任何需要监控、连接、互动的物体或过程&#xff0c;实现对物品和过程的智能化感知、识别和管理。物联网的核心功能包括数据采集与监…

Git Rebase的使用

Git rebase是Git版本控制系统中的一个重要工具&#xff0c;用于重写提交历史&#xff0c;整合分支。通过rebase&#xff0c;可以使项目历史更加简洁和清晰。本文将深入探讨Git rebase的概念、用途、具体操作及其与其他Git命令的区别。 一、Git Rebase的概念 Git rebase是将一…