科技魔方
  • 更多场景
  • 字节跳动推出X-Portrait2模型,一键生成相同表情神态

    字节跳动推出X-Portrait2肖像动画技术,通过先进的表情编码器模型和生成扩散模型,实现超低成本高效的角色动画创作。

  • 科技魔方 字节跳动字节大模型
  • 668 0
  • 告别模糊画质!超清AI图像生成模型FLUX1.1Pro Ultra发布

    FLUX1.1Pro 迎来重大更新,推出全新版本 FLUX1.1Pro Ultra,支持高达4兆像素的分辨率,生成速度大幅提升,每张图片仅需约10秒完成。

  • 科技魔方 AI图像大模型模型
  • 616 0
  • Stability AI发布全新 Stable Diffusion3.5生成模型,三个版本、速度大提升

    Stability AI最近推出了全新的深度学习文本到图像生成模型Stable Diffusion3.5,包括三种改进的开源模型,满足不同用户需求。

    AI颠覆服装设计!FLUX.1-dev LoRA 服装生成器来了

    FLUX.1-dev LoRA 服装生成器利用先进的人工智能技术,为用户带来前所未有的时尚设计体验,让设计小白也能秒出服装效果图。

  • 科技魔方 AI服装生成器人工智能
  • 683 0
  • 阿里测试AI动漫创作工具 “Animode”:视频一键动漫化

    阿里巴巴正在测试一款名为“Animode”的AI视频创作工具,旨在简化视频动漫创作流程。

  • 科技魔方 阿里AI动漫视频
  • 591 0
  • 下载次数破39万,CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用

    VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。

  • 新智元公众号 VQAScore大模型模型人工智能
  • 527 0
  • 中国团队推世界最大多模态数据集“Infinity-MM”和顶尖微型AI模型“Aquila-VL-2B”

    近日,中国研究团队成功创建了“Infinity-MM”数据集,同时训练出了性能卓越的小型新模型“Aquila-VL-2B”。

  • 科技魔方 大模型AI模型应用硬件
  • 523 0
  • CMU、Meta联手放大招! VQAScore一个问题搞定文生图模型评测,准确性远超传统方法!

    生成式AI发展迅猛,但全面评估其性能一直是难题。近期,卡耐基梅隆大学和Meta合作推出VQAScore评测方案,利用视觉问答模型评分,准确性超越传统方法。

    OuteTTS-0.1-350M: 一种新颖的文本转语音合成方法

    Oute AI 最近发布了一种名为 OuteTTS-0.1-350M 的文本转语音合成方法,采用纯语言建模,简化了 TTS 方法,具有零样本语音克隆功能,适用于广泛的应用领域。

  • 科技魔方 OuteAI文本大模型
  • 690 0
  • AI新框架HelloMeme:超逼真实现不同图片之间的表情迁移

    HelloMeme框架通过独特的网络结构和Animatediff模块,实现了视频生成的流畅性与画质的双重提升。

  • 科技魔方 AI框架大模型模块
  • 564 0
  • -------------没有了-------------

    图赏更多>