科技魔方
  • 研究方向
  • MagicDance:基于扩散的人体运动传递框架生成逼真舞蹈视频

    近年来,计算机视觉领域的关键突破之一是MagicDance框架的问世,这是一种基于扩散的模型,旨在彻底改变人体运动传递。

  • 站长之家 MagicDance
  • 570 0
  • LangSplat:精准搜索3D世界中的对象 比LERF快199倍

    LangSplat 是一种3D 语言高斯模型,允许您按语言搜索3D 世界 。

  • 站长之家 LangSplat
  • 651 0
  • 多模态AI模型Unified-IO2:可理解和生成图像、文本、音频和动作

    近期,由艾伦人工智能研究所、伊利诺伊大学厄巴纳-香槟分校和华盛顿大学的研究人员联合开发的“Unified-IO2”标志着人工智能能力的一次巨大飞跃。

  • 站长之家 AI模型图像文本音频
  • 731 0
  • 相机制造商应对 AI 生成图片的崛起:通过嵌入数字签名来验证真实照片

    随着 AI 生成图片在世界各地变得越来越普遍,相机制造商正在采取行动来应对这一挑战。他们计划通过在照片中嵌入数字签名来验证图片的真实性。

  • 站长之家
  • 715 0
  • AI绘图模型不会写字的难题,被阿里AnyText破解了

    能准确写汉字的AI绘图工具,终于登场了!

  • 微信公众号 量子位 AI绘图模型阿里AnyText
  • 683 0
  • AI生成视频工具Assistive Video 输入描述即可生成视频

    Assistive Video是一款新的人工智能生成视频工具,用户只需输入描述所想看到内容的提示或上传图片,即可生成一段4秒钟的视频。

  • 站长之家 AI生成视频
  • 806 0
  • ​这次重生,AI要夺回网文界的一切
    ​这次重生,AI要夺回网文界的一切

    重生了,这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。

  • 机器之心Pro AI网文
  • 572 0
  • Ai换脸能把脸部变流畅吗?这3款AI换脸视频工具用起来

    Swapstream.ai是一款基于云的解决方案,无需安装软件,对于那些对下载应用程序持谨慎态度的用户而言是一个极富吸引力的选择。该工具声称其准确率高达99%,能够提供令人惊叹的结果。

  • 站长之家
  • 669 0
  • InternVL:60亿参数视觉语言基础模型填补多模态AGI的差距
    InternVL:60亿参数视觉语言基础模型填补多模态AGI的差距

    近期,人工智能领域一直将视觉和语言的无缝整合作为关注焦点,特别是在大型语言模型(LLMs)的出现下,该领域取得了显著进展。

  • 站长之家
  • 651 0
  • Midjourney开始训练视频模型 V6将有重大版本更新

    Midjourney昨晚发布了一些重要的消息,称他们即将开始训练视频模型,并且计划从一月开始进行这项工作。

  • 站长之家
  • 570 0
  • -------------没有了-------------

    图赏更多>