科技魔方

EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人

更多场景

2024年11月25日

  EchoMimicV2是最新的动画生成技术,支持输入一张图、一段手势视频和一段音频,能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节,简化生成过程,并引入头部局部注意力机制来解决数据稀缺问题。

  EchoMimicV2通过简化控制条件,实现高质量的半身人类动画生成。

  采用 Audio-Pose Dynamic Harmonization 策略,提升动画细节与表现力。

  新基准评估方法显示,EchoMimicV2在效果上优于现有技术。

+1

来源:科技魔方

延展资讯