对于生成音乐领域来说,这是多事的一年。
4 月,第一张病毒式AI 封面发布:代笔人的《Heart on My Sleeve》,它唤醒了音乐界,让他们认识到 AI 内容不仅可以存在,而且可以是好的。
不久之后,谷歌推出了MusicLM,这是一种文本到音乐的工具,可以根据基本提示生成歌曲;保罗·麦卡特尼 (Paul McCartney) 使用人工智能为披头士乐队的新曲目提取约翰·列侬 (John Lennon) 的声音;格莱姆斯向创作者提供了使用人工智能克隆她的声音的歌曲流的 50% 的版税。也许最重要的是,Meta 开源了MusicGen,这是一种音乐生成模型,可以将文本提示转换为高质量的样本。仅这一举措就催生了一系列新应用程序,这些应用程序使用和扩展该模型来帮助人们创建曲目。
类似于乐器、录制的音乐、合成器和采样器在推出时都增加了音乐创作者和消费者的数量,我们相信生成音乐将通过模糊艺术家、消费者和制作人之间的界限来帮助艺术家实现类似的创造性飞跃和表演者。通过极大地减少从想法到创作的摩擦,人工智能将使更多的人能够创作音乐,同时也提高现有艺术家和制作人的创作能力。
在这篇文章中,我们将深入了解人们今天在做什么,探索人工智能音乐可能的发展方向,并概述一些处于该领域前沿的新兴公司和能力。为了便于理解,这篇文章围绕 5 个核心用例构建,但我们发现另一种对这些产品进行分类的有用方法是按目标受众——为日常消费者构建的产品与具有商业用例的产消者/创造者有很大不同。我们展示了下面的重叠:
实时音乐流媒体
到目前为止,大多数新兴的生成流媒体产品都属于功能性音乐类别:Endel、Brain.fm和Aimi等应用程序。它们会生成永不停歇的播放列表,帮助您进入某种情绪或头脑空间,然后根据一天中的时间和您的活动进行调整。(然而,功能性音乐开始与传统音乐融合,像 UMG 这样的强大唱片公司与 Endel 这样的生成音乐公司合作,创建流行新专辑的“功能性”版本。)
在 Endel 应用程序中,您可以听到处于“深度工作”模式与“尝试放松”模式时的声音有何不同。Endel 还与创意人士合作,根据他们的作品制作音景,例如生成专辑。
音乐流媒体领域的大多数产品都专注于音景或背景噪音,并且它们不产生人声。但是,不难想象未来人工智能驱动的流媒体应用程序也可以用人工智能生成的声音创作更多传统音乐。正如录制的音乐带来了长时间播放专辑作为一种音乐格式一样,我们可以想象生成模型使“无限歌曲”成为一种新格式。
如果您不必用文本提示产品,这会变得更有趣。如果您可以提供有关您感兴趣的流派或艺术家的一般指导,甚至允许它在不需要提示的情况下从您过去的收听历史中学习,该怎么办?或者,如果该产品连接到您的日历以在大型会议之前提供完美的“激励”播放列表会怎样?
Spotify 一直在向个性化、自动生成的播放列表迈进。今年 2 月,他们推出了一款AI DJ,可以设置精选的音乐阵容和评论。它基于您听过的最新音乐以及您最喜欢的旧音乐 - 而且它会根据您的反馈不断刷新阵容。本月,他们推出了“ Daylist ”——一个自动播放列表,可以根据您通常在特定时间收听的内容每天更新多次。
不出所料,Spotify 并没有生成新音乐,而是从现有歌曲中整理这些播放列表。但该产品最先进的版本可能会涉及人工智能生成和人类创建的内容、音景、乐器和歌曲的组合。
音乐旅途中的时刻
Midjourney 和 Runway 等产品使消费者能够创建令人印象深刻的视觉内容,而以前需要了解和使用昂贵、专业且繁琐的工具。我们已经看到图形设计师等创意专业人士采用这些早期的生成式人工智能工具来加快工作流程并更快地迭代内容。我们期望在音乐领域看到类似的产品——人工智能驱动的工具,将灵感到表达的摩擦减少到零。
生成音乐的“中途时刻”——当创作一首高质量的曲目对于日常消费者来说变得足够快速和容易时——将对音乐行业产生巨大的影响,从专业制作人和艺术家到新一类的消费者创作者。
我们的终极梦想?一种端到端工具,您可以以文本、音频、图像甚至视频的形式提供有关您想要创建的曲目的氛围和主题的指导,然后人工智能副驾驶将与您合作编写并制作歌曲。我们并不认为最受欢迎的歌曲将完全由人工智能生成——音乐中存在人为因素,以及与艺术家之间无法替代的联系——但是,我们确实期望人工智能的帮助将使普通人成为音乐家。我们喜欢这个声音!