最近,Adobe与密歇根大学合作研发的MultiFoley人工智能系统,标志着音效生成技术的一次重大突破。
该系统能够通过文字提示、参考音频或视频示例生成高质量的音效,音频输出质量达到48kHz,且与视频的同步精度高达0.8秒,显著优于传统系统。
MultiFoley系统通过文字、音频和视频输入生成音效,音质达到48kHz。
平均同步精度为0.8秒,显著优于传统音效系统的表现。
用户研究显示,85.8%的参与者认为其语义一致性优于其他系统。
最近,Adobe与密歇根大学合作研发的MultiFoley人工智能系统,标志着音效生成技术的一次重大突破。
该系统能够通过文字提示、参考音频或视频示例生成高质量的音效,音频输出质量达到48kHz,且与视频的同步精度高达0.8秒,显著优于传统系统。
MultiFoley系统通过文字、音频和视频输入生成音效,音质达到48kHz。
平均同步精度为0.8秒,显著优于传统音效系统的表现。
用户研究显示,85.8%的参与者认为其语义一致性优于其他系统。