字节跳动推出X-Portrait2肖像动画技术,通过先进的表情编码器模型和生成扩散模型,实现超低成本高效的角色动画创作。
FLUX1.1Pro 迎来重大更新,推出全新版本 FLUX1.1Pro Ultra,支持高达4兆像素的分辨率,生成速度大幅提升,每张图片仅需约10秒完成。
Stability AI最近推出了全新的深度学习文本到图像生成模型Stable Diffusion3.5,包括三种改进的开源模型,满足不同用户需求。
FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术,为用户带来前所未有的时尚设计体验,让设计小白也能秒出服装效果图。
VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。
近日,中国研究团队成功创建了“Infinity-MM”数据集,同时训练出了性能卓越的小型新模型“Aquila-VL-2B”。
生成式AI发展迅猛,但全面评估其性能一直是难题。近期,卡耐基梅隆大学和Meta合作推出VQAScore评测方案,利用视觉问答模型评分,准确性超越传统方法。
Oute AI 最近发布了一种名为 OuteTTS-0.1-350M 的文本转语音合成方法,采用纯语言建模,简化了 TTS 方法,具有零样本语音克隆功能,适用于广泛的应用领域。
HelloMeme框架通过独特的网络结构和Animatediff模块,实现了视频生成的流畅性与画质的双重提升。
-------------没有了-------------