北京时间12月6日凌晨2点,科技圈的营销高手OpenAI正式开启了他们的“Shipmas”产品发布季。这一活动显然受到圣诞日历(Christmas Calendar)传统的启发,OpenAI计划在接下来的12个工作日中,每天为全球科技圈带来一份“圣诞礼物”。
在今天的发布会上,OpenAI首席执行官Sam Altman亲自宣布,公司将在工作日陆续推出新产品和功能更新。
发布会的开场,Sam Altman提到新版o1在处理复杂问题时的错误率降低了34%,并且能够根据题目的难易程度调节处理时间。困难题目可能需要几分钟,而简单题目仅需几秒,这使得用户的等待时间减少了超过50%。
根据数据显示,o1在国际数学奥林匹克预选赛题目(AIME 2024)中的正确率达到了83%,远超GPT-4o的13%和o1 preview的56.7%。在编程能力测试(CodeForces)中,o1的正确率从GPT-4o的11%跃升至89%,展现出强劲的实力。
值得一提的是,在处理博士级科学问题(GPQA Diamond)时,o1的准确率达到了78%,超越了人类专家的69.7%。此外,o1现在也支持多模态识别,能够处理图像和文本的结合。
在发布会现场,o1的负责人展示了一个关于太空数据中心的系统草图,o1准确识别并计算出所需的散热片面积,显示出其强大的实用性。
如果说o1的升级在预期之中,那么月收费200美元的ChatGPT Pro则让人感到惊讶。尽管之前有传闻称OpenAI会推出这一套餐,但许多人对此价格持怀疑态度。
在这个套餐中,OpenAI提供了最强的o1 pro模式。根据Sam Altman的解释,这一模式在处理复杂问题时能够获得更多的算力和能量。在国际数学奥林匹克预选赛题目中,o1 pro模式的正确率达到了86%,在编程和科学问题上也表现出色。
为了展示o1 pro模式的强大,OpenAI设计了一套严格的“四次测试”评估,模型需要连续四次答对同一个问题才能通过。在这种条件下,o1 Pro模式依然保持了高可靠性,显示出其稳定性和一致性。
ChatGPT Pro版客户还将享受到完整的GPT-4o访问权限,提供无限使用,不用排队。
这仅仅是12天发布计划的第一天。OpenAI的“圣诞营销”节奏掌握得相当不错,第一天就放出了业内预测会在这十二天发布的最重要的产品之一——“满血版”o1。这一力度无疑会激发大家对接下来更新的好奇心。
在直播的最后,OpenAI的研究员分享了一个圣诞冷笑话,增添了发布会的趣味性。