OpenAI 最新更新：画布、视觉微调与更多创新

April 7th, 2025

在 9 月份发布 o1 模型后，OpenAI 再次为人工智能领域带来了新的突破。这些变化的重要目标是提升用户体验，优化 ChatGPT 的交互方式。从用户界面到技术整合，每一次改进都旨在更高效、更直观，推动这款应用步入更广泛的应用领域。

Canvas 是 OpenAI 在 ChatGPT 中带来的一次重要用户界面更新。该功能采用双屏布局，左侧边栏负责显示提示，右侧窗口展示生成的内容。这种设计打破了原先单屏聊天式结构的局限性，为多任务处理创造了更高效的工作体验。

使用 Canvas 时，用户可以方便地对文档或代码片段进行选择性编辑，而无需修改整体内容。此外，界面自带边栏和主窗口大小调整功能，让用户能够根据习惯优化工作环境。

Canvas 自动检测用户的操作需求，如编辑、写作或编码，并相应切换到双屏布局。这种智能识别使得更复杂的任务处理更加流畅。目前，该功能仅支持 GPT-4o，但预计很快会向更多用户开放。

OpenAI 最近发布了三个新的 ChatGPT API 更新，这些更新进一步增强了模型性能和开发者的灵活性。

新引入的模型蒸馏技术允许开发者利用高级模型，如 GPT-4o 的生成结果，来优化较小型的经济模型。这使得开发者能够以更低成本实现更高质量输出。通过 API 捕获高级模型的输入输出对并生成数据集，开发者无需手动协调任务，极大地简化了模型训练过程。

针对频繁重复的 API 调用，提示缓存功能显著降低了系统的运算成本。当应用长提示进行操作时，系统会保存最近使用过的部分，并在后续请求中复用该内容。这种优化不仅提升了效率，还减少了延迟。

实时应用程序接口简化了语音助手的开发流程，让用户能够通过自然对话进行实时交互。这项功能支持从语音转录到音频生成的一站式处理，并实现了更快速的响应。支持多语种的扩展选项进一步增加了该功能的适用性。

视觉微调是 GPT-4o 的一大突破。开发人员现可使用图像数据集对模型进行微调，以满足特定的应用需求。比如在自动化流程中，模型能够识别用户界面元素，从而与系统进行更高效的交互。这种灵活性使得模型适应性更强，显著减少人工维护的成本。

微调所需数据量可以灵活调整，最低仅需 100 张图像，最大可达 50,000 张图像。这为开发者开展多样化实验提供了充分的弹性支持。