OpenAI整合Sora至ChatGPT，提升图像生成体验

April 7th, 2025

OpenAI于本周正式宣布，将其图像生成工具Sora整合到ChatGPT平台。这项新的功能命名为“ChatGPT中的图像”，现在用户可以直接在ChatGPT中生成图像，而无需访问独立的Sora网站。这一改变不仅提升了使用便捷性，也进一步丰富了ChatGPT的功能模块。

Sora的进化与功能范围

早期发布的Sora以人工智能视频生成工具的身份出现在公众视野，但随着技术的推动，此次整合仅专注于图像生成能力。所有ChatGPT用户，无论其使用的是Plus、Pro、Team还是免费计划，都可以访问这一新功能。需要注意的是，免费用户的使用权限将有所限制，具体次数尚未公布，但可能会根据需求动态调整。

OpenAI对这一整合充满信心，并希望通过逐步更新和功能增强，让所有用户体验到前沿的AI图像生成技术。

针对这一功能的背后技术进步，OpenAI的研究负责人Gabriel Goh披露了一些细节。他提到，新的图像生成系统基于GPT-4o模型，突破了图像生成领域的多个技术瓶颈：

细节绑定技术（Binding）：这一技术显著提高了复杂场景多元素的关系处理能力。例如，用户可以同时要求多种颜色、形状元素且生成结果无误。
文本渲染优化：AI工具常常在生成图像中的文字时出现缺失或错漏的问题。而Sora针对这一点进行了多月的优化，使得生成的文字表现更准确、可读性增强。
生成流程的序列性改进：不同于传统基于扩散模型的方式，Sora采用了逐步自回归绘图的方法，从图像的左上角开始逐行生成。这种方式帮助提升了画面细节和文本的完整性。

据悉，尽管图像生成速度有所减缓，但生成质量的提升让等待成为值得的折衷。