EchoMimicV2是最新的动画生成技术,支持输入一张图、一段手势视频和一段音频,能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节,简化生成过程,并引入头部局部注意力机制来解决数据稀缺问题。
EchoMimicV2通过简化控制条件,实现高质量的半身人类动画生成。
采用 Audio-Pose Dynamic Harmonization 策略,提升动画细节与表现力。
新基准评估方法显示,EchoMimicV2在效果上优于现有技术。