人工智能正逐渐渗透到各行各业,其中一项重要的进展是通过长篇文本生成自然人类运动,这在动画、游戏和电影等领域具有巨大潜力。
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。
众所周知,随着AIGC相关技术最近这一两年快速成熟,也使得AI绘图早已经不再仅仅是部分PC发烧友或AI爱好者的“玩具”。
在上周的开发者大会上,微软宣布了其在人工智能竞赛中的最新贡献:一款可以生成新头像和声音,或复制用户现有外观和语音的软件,这引发了人们对它可能加剧深度伪造创造的担忧。
来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
微软近日发布了一项名为Personal Voice的新技术,该技术可以克隆用户的声音,并且能够复制出与原声音完全一致的人工智能语音。用户只需提供1分钟的语音样本,Personal Voice就能在几秒钟内生成相应的AI语音。
Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。
-------------没有了-------------