昨晚半夜,OpenAI正式发布了o1预览版!这是一系列新的AI模型,旨在通过花更多时间进行思考来提高响应的准确性。
OpenAI解释道:
对于复杂推理任务,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为1,并将这一系列命名为OpenAI o1。
简单来说,这个强悍的模型,甚至让OpenAI放弃了过去GPT系列的命名,重新推出了o系列。o1的发布也标志着AI行业将快速推进AGI。
OpenAI最新版本的o1模型在数学能力、代码能力以及其他理科类问题上表现得非常出色。例如,在AIME 2025数学竞赛中,GPT-4的准确率为13.4%,而o1预览版为56.7%,预计正式版将达到83.3%。在代码竞赛中,GPT-4的准确率为11.0%,o1预览版为62%,而o1正式版则为89%。
特别是在测试化学、物理和生物学专业知识的基准GPQA-diamond上,o1的表现超越了人类博士专家,这也是有史以来第一个获得此成就的模型。
未来,文科类问题仍然推荐使用Claude,而理科类问题可以使用OpenAI的o1-preview模型。
目前,o1模型在功能上有所限制,尤其是它并不具备图像理解、图片生成、代码解释器、网页搜索等功能,只有一个可以进行对话的基础模型。
o1模型已逐步向所有ChatGPT Plus和Team用户开放,付费用户才可使用最新的o1模型。
o1:新的大模型,功能强大,但不适合公开使用。
o1-preview:o1的预览版,ChatGPT付费用户和API用户可立即使用。
o1-mini:更小、更便宜、速度更快,适用于推理任务但无需广泛世界知识的场景。
o1-mini具有更快的速度和较低的费用,非常适合数学和代码等推理任务,但它的世界知识会有限。
o1-preview:每周使用限制为30条。
o1-mini:每周使用限制为50条。
我尝试了o1模型,并提出了一个经典的推理问题:“农夫需要把狼、羊和白菜带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河?”经过6秒钟的思考,o1给出了一个完美的答案,表现相当出色。
在姜萍的比赛奥数题中,o1模型花费了1分多钟思考后,给出了完全正确的答案,这让我惊叹不已。
根据我的使用经验,以下提示词能够提高o1模型的回答质量:
保持提示简单直接:o1擅长理解简洁、清晰的指令。
避免思路链提示:不需要提示模型“逐步思考”或“解释推理”。
使用分隔符:使用三重引号、XML标签或章节标题等分隔符,帮助模型清晰理解不同部分。
限制检索增强生成中的附加上下文:仅提供最相关的上下文信息,避免过度复杂化模型的响应。
根据官方通知,o1-preview的使用限制为每周30条,o1-mini为每周50条。若超过限制,将显示如下提示:
You’ve hit the Plus plan limit for o1-previewResponse will use another model until your limit resets.
当达到限制时,只能使用其他模型,直到o1-preview的使用限制重置。
个人认为,o1模型在许多任务中展现了其强大的能力,但由于思考时间较长且每周有使用限制,它可能并不适合日常使用。然而,o1的未来潜力巨大,它代表了我们迈向下一代人工智能的基石。
目前,o1模型已全面向所有ChatGPT Plus和Team用户开放,只有升级为ChatGPT Plus的用户才能使用o1模型。但由于OpenAI限制了国内银行卡,使用国内银行卡支付时可能会遇到绑定失败的问题。
最佳的解决方案是通过海外虚拟信用卡进行支付升级,推荐使用WildCard虚拟卡。它能够方便地完成ChatGPT Plus的付费升级,基本上2分钟就可以完成操作。
进入WildCard官网并点击“立即开通”。
在“我的卡片”页面开通虚拟信用卡,选择2年计划。
使用官方邀请码ACCPAY可以获得开卡优惠。
成功注册后,进入WildCard首页,点击导航栏的“ChatGPT Plus一键升级”按钮,按照官方教程完成升级。
通过以上步骤,您可以轻松使用OpenAI最新的o1模型,并升级到ChatGPT Plus以体验更多功能。如果遇到任何问题,可以随时联系在线客服。
使用门槛极低,微信支付宝均可开通使用。支持开通各类海外平台:ChatGPT、Claude、Google Play、Apple Store、OpenAI、X、Patreon、MidJourney、Amazon、POE、Microsoft、Facebook、GitHub、Telegram、PayPal等各类海淘订阅平台。使用邀请码:ACCPAY,立享消费0手续费,减免开卡费用。