据 Huggingface 报道,Meta AI 近日推出一款用于音乐生成的新码本模式 Stack-and-Delay。
据悉,在文本生成音乐模型中,模型会根据码本模式以自回归方式或并行解码。其中扁平化码本代表了最高质量的解码策略,但速度却非常慢。
因而 Meta AI 推出了 Stack-and-Delay 这种全新的解码策略,其生成速度比普通平面解码快四倍。这使得推理时间接近延迟解码策略的时间,并且允许在小批量大小的 GPU 上进行更快的推理。
主观评估表明,在给定相同文本提示的情况下,新模型生成的样本通常比竞争模型生成的样本更受欢迎。