本文来自于微信公众号 雷科技(ID:leitech),作者:雷科技。
自从ChatGPT面世以来,生成式AI已经给我们带来了诸多惊喜,并且AI对于不同行业的影响力还在不断扩散。2024年才刚过去3个月,就已经涌现出一批新的AI大模型:文字生成视频的Sora、支持200万字长文本处理的Kimi,以及文生音频的新星——Suno。
「音乐界的ChatGPT」、「可能席卷全世界的可怕AI音乐」、「颠覆音乐圈」,这些是无数网友和媒体在体验过Suno后给出的真实评价。
Suno是AI初创公司Suno推出的音乐生成模型,无论用户是否拥有乐理知识,只需输入简单的提示词,比如音乐风格、音乐流派、歌词内容、音色等,等待几秒就能快速生成带有歌词和节拍的2分钟音乐。
值得注意的是,近期Suno公司还推出了V3版本,该版本首次能够生成广播质量的音乐,并新增了更丰富的音乐风格和流派选项,比如古典音乐、爵士乐、Hiphop、电子等新潮曲风。官方表示V4版本已经在开发中,并计划推出全新功能。
Suno初体验:一键成歌,效果惊艳
看到这里,雷科技抱着好奇打开了Suno官网。我们首先看到的是许多首由Suno生成的音乐,以英文歌曲为主。随机试听了几首之后,感觉旋律还挺上头,这让我对Suno的表现有了更高的期待。
点击右上角的制作按钮,就能进入到主界面了。在探索页面,我们能看到由网友创作的优秀作品,有电子音乐、重金属摇滚、传统民谣、蓝调等不同流派,Suno根据播放量和点赞量对歌曲进行排名。可以看出,Suno支持包括中文、英文在内的多种语言,对中文生成的AI歌曲非常友好。像「如梦令」、「水调歌头」等歌曲听起来十分舒服,相当符合国人的歌曲喜好。
注册好账号,我们打开创造页面。整体界面和ChatGPT类似,拥有关键词输入框、音乐流派、模型选择等选项。
话不多说,下面正式开始「音乐小白」的创作之路。为了体现Suno的实力,雷科技特意用中文输入了自己都无法理解的关键词:「用民谣描述关于金刚与哥斯拉的爱情故事」。
等待数秒后,雷科技第一首歌曲「金刚与哥斯拉的爱情故事」制作完成。从歌词来看,Suno精准识别到了金刚和哥斯拉两个关键词,并在它们怪物身份上延伸出了战斗等场景描述。
点击播放歌曲,结果让我感到震惊,完全不相信这是由我给予的关键词创作而成的歌曲。至少听起来没有AI生成常有的生涩感,歌词押韵,甚至还附带有和声、分段。作为「音乐小白」,雷科技感觉这首歌曲是符合要求的,具体效果大家可以听听看。
随后雷科技连续生成了几首不同流派、不同主题的歌曲,新鲜感过去后,雷科技发觉Suno生成相同曲风的歌曲有种千篇一律的感觉,虽然歌词和旋律不一样,但个人感觉与抖音上常听的口水歌非常相似。
在查阅资料的过程中,雷科技发现Suno原来还有进阶玩法。在创造界面的自定义模式下,用户可以自行制定Intro(引子或前奏)、Verse(诗歌部分 / 主歌)、Chorus(合唱部分 / 副歌)、Bridge(桥接部分)、Outro(尾奏)等部分的歌词,并通过关键词技巧,让AI理解用户表达。
因为涉及到实际乐理知识,不懂音乐的朋友理解起来相当麻烦,雷科技将其总结为:「风格+情感+乐器+节奏+人声」。如果你觉得自己想歌词太麻烦,但又对歌词感兴趣,可以结合ChatGPT,让AI生成符合你要求的歌词文本。
如果你想参考现有歌曲的节奏,则需将歌曲的BPM(节奏)和Key(调高)输入到关键词中。
一番体验下来,雷科技认为Suno表现十分惊人。无论是面向小白的一键生成,还是专业向的自定义生成,都能在极短时间内生成出颇具质量的歌曲。尤其是自定义生成,探索页面的优秀作品向我们展示了Suno的无限可能。至少从目前看来,还没有人能断言Suno V3版本的上限,每日不断涌现的最新作品就是最好的证明。
目前Suno新注册用户每天能生成10首歌曲,对于玩票性质的普通用户已经足够,如果你还有更多需求,还可以订阅「Pro」和「Premier」计划,分别是8美元/月和24美元/月。
AI音乐强大但“人类音乐”永远无可替代
可能有很多人会感到好奇,究竟是一家什么样的公司才能创造出如此神奇的Suno V3。目前,Suno团队成立仅两年,团队成员只有12个人,部分团队成员此前服务于Meta、TikTok和Kensho Technologies等科技公司。
其实在Suno出现之前,市面上已经出现了数款AI音乐生成工具,Dream Track、Jammable以及Project Music GenAI就是其中的代表。Suno之所以能在互联网上形成病毒式传播,主要原因是其简化了普通人创造歌曲的步骤,用户只需简单引导就能自动完成人声、歌词、风格、曲谱等内容。
这令普通人与专业音乐创作者之间的差距瞬间缩小,就像Midjourney生成图像引起设计行业动荡那样,Suno同样引起了部分音乐人的警觉。虽然现阶段Suno的创作水平还远远没有达到足以颠覆音乐圈的阶段,但AI最可怕的是学习能力。Suno团队在2023年7月才在生成模型中加入了人声音乐功能,仅仅过去9个月时间,就已经迭代至V3版本,或许没有人能预测出Suno的最终水平。
在雷科技看来,Suno确实可以让普通人大批量创造「原创」歌曲,但颠覆音乐圈的可能性不高。
首先,歌曲的本质是人们的自我表达,和文字、图片是一个道理,只不过歌曲的表现形式更为复杂,光是声音层次就能形成若干种可能。
AI固然可以通过高强度的学习,还原出各种声音与曲风,甚至未来还能形成连贯性的长音乐。
但一首好的歌曲之所以能与听众形成共鸣,是因为它与人、社会有着充分联系,这也是为什么我们在听部分歌曲时会激动、会难过的原因。而AI音乐暂时还没有表现出对应的能力,鉴于当前情况,我更愿意称之为「无情的创作机器」。
其次,还是老生常谈的版权问题。Suno团队至今未公布Suno模型是用什么数据训练而成,如果他们在未经允许的情况下,使用了有版权保护的作品,那么他们将面临起诉,而用户借助Suno生成的音乐作品也有着同样的风险。
许多用户除了生成全新歌曲外,还会对现有歌曲进行二创,这部分操作是否合法,至今仍未有定论。AI生成内容给现有法律体系带来了不少难题,AI网文、AI图像,AI音乐、AI复活等技术的诞生给知识产权带来了新的复杂性,如何避免法律风险,合法且道德引导用户使用Suno制作音乐,是阻碍Suno发展的首要难题。
实际上,Suno团队也意识到了AI音乐和音乐圈之间的复杂关系,他们表示团队正致力于让人们深入接触音乐创作,而非替代音乐家。
最后,Suno真正颠覆的应该是专门打造网络神曲的制作公司,一直以来,公式化创作歌曲是这批公司的强项,但Suno显然比他们更具优势。在Suno的冲击下,这个行业又将迎来新一轮洗牌。
Suno是偶然AIGC重构内容产业是必然
大模型进入人们视线范围的时间其实并不长,但它给人们生活带来了切切实实的改变。更高的效率和更低的门槛,两者是大模型的最大魅力。在「AI+X」的场景中,过去行业的限入门槛没了,人人都可以是创作者,每个人都能尽情表达自我。
Suno像ChatGPT、Sora、Kimi等诸多前辈一样,成功引起了对应行业的震撼。虽说还无法达到人类输出实际情感的要求,但其歌曲生成效率已经成功打败了99%的音乐人,并且这个优势还会不断扩大。
雷科技实际体验Suno的时间并不长,但在攻略的帮助下已能创作出一些看似有点专业性的歌曲。「音乐小白」尚且如此,专业音乐创作者使用Suno的效率必然更高,得到的惊喜自然也会更多。
当AI音乐泛滥,用户如何在歌曲海洋中找到符合自己审美的音乐,或许又会成为新的难题。大模型与音乐内容结合的新一代AI音乐推荐,也将迎来新的机会。
Suno以及其代表的AIGC平台,正在重构内容产业秩序。
雷科技想起了抖音以及TikTok。从名字可以看出,抖音十分注重“音乐”在短视频内容中的价值,TikTok的前身业务很大一部分源自于字节收购的Musical.ly。毫不夸张地说,抖音以及TikTok均是从“音乐”出发去建构了短视频帝国,这正是快手等短视频平台不具备的特质。如今,抖音在事实上也已成为网红音乐制造机。
因此,Suno的出现,以及AIGC的爆发,最直接冲击的应该是抖音等短视频内容平台,因为内容的生产逻辑正在发生剧变。或许正是因为此,一手将抖音做大的抖音集团前CEO会辞任转而主攻剪映。字节在AIGC上的储备与实力跟其体量无法匹配,也无法跟微软、Google、Meta、百度、阿里等巨头比肩。好在字节正在加码AIGC,因为AI是字节的基因,AIGC是字节最不能输的战争——至于游戏、教育、飞书等业务,都不属于核心。
AIGC的浪潮正以超出所有人预期的速度,奔涌而来。