OpenAI 于今日(2/1)宣布,最新的 o3-mini 正式登场!这款小型推理模型(reasoning model)专为 STEM 领域(科学、数学、程序设计)优化,在维持低成本与低延迟的同时,提供强大的逻辑推理能力。相较于前代 o1-mini,o3-mini 运算更快、回答更准确,且错误率降低 39%,是目前最具竞争力的轻量级 AI 模型之一。
o3-mini 今日起正式开放,可通过 ChatGPT(含 Plus、Team、Pro 方案)及 OpenAI API 访问,企业版本则将于 2 月 开放。更值得关注的是,这是首次开放给免费用户试用的推理模型,任何人都可在 ChatGPT 选择「Reason」模式或重新生成回应来体验。
👉 野卡 WildCard | 一分钟注册,轻松订阅海外线上服务
o3-mini 是 OpenAI 首款支持开发者热门功能的小型推理模型,包括:
函数调用(Function Calling) — 让 AI 与应用程序无缝整合
结构化输出(Structured Outputs) — 产生 JSON、表格等格式的数据
开发者消息(Developer Messages) — 增强 API 交互体验
串流回应(Streaming) — 支持实时流式输出,提升互动效率
这些功能让 o3-mini 成为真正可用于生产环境的 AI 推理模型,开发者可以立即整合到应用程序或服务中。
开发者可选择 低、中、高 三种推理等级(reasoning effort):
低推理模式(Low) — 速度最快,适合简单任务
中推理模式(Medium) — 平衡速度与准确性,适合大多数应用
高推理模式(High) — 进行更深入计算与分析,应对高难度问题
这项设计让 o3-mini 既能快速回应常规问题,又能在遇到复杂挑战时「思考更深入」,提升应用场景的灵活性。
测试结果显示,o3-mini 在 STEM 领域表现比 o1-mini 更精确,并能在部分领域与 o1 平起平坐:
数学(AIME 2024 测试) — 高推理模式下达 83.6% 准确度,远超前代
博士级科学问答(GPQA Diamond 测试) — 高推理模式下达 77% 准确度
研究级数学(FrontierMath 测试) — 高推理模式能解决 32% 难题,其中 28% 属高难度问题(T3)
竞赛级程序设计(Codeforces 测试) — 最高 Elo 分数达 2073,超越 o1-mini
软件工程(SWE-bench 测试) — 高推理模式下准确率达 48.9%
这些结果显示,o3-mini 特别适合数学、科学、程序设计等技术领域,能帮助开发者解决更复杂的问题。
与 o1-mini 相比,o3-mini 回应时间平均缩短 24%:
⏱ o3-mini 回应时间:7.7 秒
⏳ o1-mini 回应时间:10.16 秒
这意味着不仅可处理更复杂的问题,还能以更快的速度提供解决方案,对于实时应用(如聊天机器人、客服系统)而言是一大优势。
为了让更多用户体验 o3-mini 的强大功能,OpenAI 也对 ChatGPT Plus 和 Team 订阅方案进行升级:
Plus & Team 订阅者:每日消息上限从 50 增加到 150
Pro 订阅者:可无限访问 o3-mini 及 o3-mini-high
此外,o3-mini 也支持 实时搜索,可提供带有网页来源的最新答案,这是 OpenAI 在整合搜索技术上的新尝试。
现在,开发者与用户可以通过多种方式访问 o3-mini:
✅ ChatGPT 用户(免费 & 付费)
免费用户 — 选择「Reason」模式 或 重新生成回应 即可体验
Plus、Team、Pro 用户 — 可直接在 ChatGPT 内选择 o3-mini,享受更高效能与更快响应
✅ 开发者(API 访问)
API 使用层级 3-5 的开发者可访问 Chat Completions API、Assistants API、Batch API
企业用户将于 2 月 获得完整访问权限
o3-mini(标准版) — 中等推理模式,适合大多数应用
o3-mini-high(高推理版) — 进行更深入计算,适合高难度问题(仅限 Pro 方案)
OpenAI 表示,o3-mini 代表着 OpenAI 在小型推理模型领域的重大突破,带来更高效、更准确、更灵活的 AI 方案。无论是开发者、科学家、数学家、程序员,甚至是一般用户,都能通过 o3-mini 享受到高品质的 AI 推理能力。