Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。
Lyria的设计目标是为用户提供对输出的风格和表现更为微妙的控制。Demis Hassabis,Google DeepMind的联合创始人兼首席执行官,在Twitter上表示:“仅凭一个文本提示,Lyria就能产生引人入胜的音乐和人声。”
这一新模型将与YouTube合作推出实验性的创意工具,其中包括Dream Track。Dream Track是一个用于YouTube Shorts的语音克隆工具,用户只需提供与艺术家一起制作音乐的文本输入,该工具将生成包含艺术家克隆声音的30秒片段,其中包括T-Pain和Charlie Puth等艺术家的声音。
此外,Lyria还将推动一系列音乐AI工具,旨在帮助艺术家和制作人增强其创意过程。用户可以从零开始创建新音乐或乐器部分,也可以重新构想现有的音乐曲目。
与Lyria的推出同时,Google DeepMind团队还宣布扩展其AI检测工具SynthID,以覆盖由Lyria生成的音频。SynthID最初是在八月底发布的,它可以通过检测直接嵌入图像像素的数字水印来识别由AI生成的图像。现在,这一工具已经扩展到音频领域,通过将水印嵌入到Lyria生成的音频波形中,来保护音乐免受编辑和内容侵权的影响。
这个水印设计得非常坚固,可以经受噪声添加、MP3压缩以及音轨被加速或减速等编辑,后者是绕过YouTube的ContentID检测工具的常见手段。
在Lyria最新模型推出后,Google DeepMind表示计划继续与其音乐AI孵化器的参与者一起测试AI工具,其中包括环球唱片公司。该唱片公司在八月份与YouTube签署了一项协议,以尝试使用AI工具,为Johnny Cash和Frank Sinatra的亲属提供了AI版本的音乐作品,这些作品已经在YouTube上发布。
Lyria的推出标志着谷歌研究人员长期以来在AI音乐生成领域的实验。在今年一月份,他们推出了MusicLM,该模型可以根据文本提示生成五分钟的音频片段。