AIGC(AI-Generated Content,人工智能生成内容)标志着新一轮范式转移的到来。随着硅谷的风险投资机构逐渐将目光投向 AI 初创公司,尤其是在生成式 AI 艺术领域,AIGC 赛道正变得愈发炙手可热。今年,Stability 和 Jasper 两家公司分别获得了超过一亿美元的融资,估值突破十亿美元。这一现象不仅源于技术的快速发展、商业应用的广泛性和需求的不断增长,还得益于这一领域尚处于初期阶段,大型科技公司虽然占据了大量市场份额,但初创企业依旧拥有突围的机会。
随着 Web3.0 时代的到来,人工智能、关联数据和语义网络构建了人与网络的新型链接,推动了内容消费需求的迅速增长。在此背景下,传统的 UGC 和 PGC 内容生成方式已经难以满足日益扩展的需求。AIGC 将成为新的元宇宙内容生成解决方案。它利用人工智能学习知识图谱,自动生成内容,帮助提高创作效率,丰富内容多样性。随着 NLP(自然语言处理)技术和扩散模型(Diffusion Model)的不断进步,AI 逐渐从辅助工具转变为内容创作的主力军,未来将有望替代文字生成、图像绘制、视频剪辑以及游戏内容的创作。
AIGC 技术主要包括自然语言处理(NLP)和 AIGC 生成算法两大核心技术。自然语言处理旨在实现人与计算机之间通过自然语言的交互;而生成算法中,生成对抗网络(GAN)和扩散模型是目前的主流。扩散模型由于具备更高的精度、更强的可扩展性和更高的并行性,正在成为下一代图像生成的主力工具,推动了 AIGC 产业的快速增长。与此同时,AIGC 的发展还依赖于强大的算力,目前以英伟达 A100 为主的底层硬件设备对算力的需求正呈现飞速增长。
AIGC 在文字、图像、音频、游戏和代码生成等领域已经逐渐显现其商业潜力。通过研究国内外数十家 AIGC 企业,我们发现,一些具有高重复性且对精度要求不高的任务,已经开始逐步实现商业化,特别是在图像生成和文字创作领域。目前,许多 AIGC 服务已采用 SaaS 模式进行变现。
AIGC 的发展核心将依赖于“大模型、大数据与大算力”。结合自然语言的大型模型和数据集已成为 AIGC 发展的软件基础,OpenAI 的 Clip 模型基于 4 亿组高质量图文数据训练而成。此外,算力在 AIGC 数字时代的重要性愈加凸显。比如,Stable Diffusion 目前依赖 4000 个英伟达 A100 GPU 集群,运营成本超过 5000 万美元。未来,为了进一步提升精确度,还将更加注重基于语种的垂直应用开发。
AIGC 能否成功运作,依赖于生成算法、自然语言处理技术和算力。而高质量的数据集则决定了 AIGC 的输出质量和商业模式的成功与否。当前,AIGC 产业链的关键参与者包括:
软件层面:自然语言处理技术的领军者,如谷歌、微软、科大讯飞、拓尔思;
生成算法与数据集:代表企业包括英伟达、Meta、百度、蓝色光标、视觉中国、昆仑万维等;
算力层:澜起科技、中兴通讯、新易盛、天孚通信等企业提供算力支持。
技术发展滞后:AIGC 技术的发展可能不如预期,尤其是底层硬件技术(如超级计算机和算力)的进展可能会受限。
政策监管风险:由于 AIGC 仍处于初期阶段,未来可能会面临关于 AIGC 作品版权和其他法律监管的挑战。
2022 年,硅谷的风险投资公司开始聚焦于生成式 AI 艺术领域,AIGC 在这一年逐渐崭露头角。特别是在 9 月 23 日,红杉美国发布的文章《生成式 AI:一个创造性的新世界》中,指出 AIGC 将代表新一轮范式转移的开始。
同年 10 月,英国开源人工智能公司 Stability AI 获得了 1.01 亿美元的融资,估值突破十亿美元,成为独角兽企业。Stability AI 发布的 Stable Diffusion 模型迅速火爆,它能够根据用户的文字输入自动生成图像,为 AI 绘画领域带来了革命性的变化。
随着技术的不断成熟,AIGC 已经不仅局限于图像生成,还扩展到了文字、音频、视频和游戏内容的创作。例如:
文字生成:以 Jasper 为例,用户可以通过该平台生成社交媒体内容、营销文本、电子邮件等。截止到 2021 年,Jasper 已经拥有超过 70000 位客户,年收入超过 4000 万美元。
音频生成:Podcast.ai 利用 AI 技术生成播客内容,通过对乔布斯的传记和网络录音的分析,成功重现了乔布斯与 Joe Rogan 的假想采访。
视频生成:AI 技术不仅能生成图片,还能生成视频序列帧。在一些垂直领域(如体育、财经等),AI 已能通过文字输入生成短视频,甚至结合虚拟人实现自动播报。
随着扩散模型的逐步成熟,AIGC 正从内容创作的辅助工具,转变为创作的主体工具,未来将在各类内容创作中占据主导地位。