最近,B站UP主“小虫哥_”发布了一部原神二创视频,其中各个角色模仿芙宁娜的台词和动作,但保留了原本的声线,给网友来了亿点点震撼。截至发稿日,该视频已经获得了超过136万的播放量。
许多原神玩家被吸引的原因可能在于“陌生的熟悉感”,因为看到熟悉的角色模仿另一个角色的台词和动作,引得不少网友在评论区@同好直呼“不能只有我被创”。
有网友在评论区发问关于动作和建模的问题,还有人问“这大招语音怎么回事啊?”据UP主“小虫哥_”介绍,为了模仿原神各个角色的声线,他使用了VITS语音合成模型。
这一模型的原理是上传声音文本,经过分析提取出语言特征,然后这些特征传入声学模型,由声学模型分析出声学特征,最后这些特征被发送给声码器,由声码器把相对应的声波发送出来。简单来说,声学模型保留了原神各个角色独特的声线。不考虑技术背景,通过向VITS模型“提供声音”,任何人都可以低成本创造专属自己的“声库”。
AI声音克隆已经不再是新鲜话题,一些AI配音工具如HeyGen、AI Dubbing等都可以免费体验,降低了普通用户的使用门槛。随着技术的升级,如何在内容和形式上做出别出心裁的作品,也许是创作者们当下更应该关注的问题。