科技魔方
  • 研究方向
  • Meta AI推出新功能 包括群聊中重新创作AI图像和对Reels的支持

    Meta AI今天宣布推出一系列新功能,旨在增强用户在群聊中的体验。其中一个新功能叫做“重新想象”,允许用户通过在提示下重新创建AI图像,为群聊增添更多趣味性。

  • 站长之家
  • 593 0
  • 腾讯与悉尼大学联手打造GPT4Video:显著提升大语言模型视频生成能力

    在多模态大型语言模型(MLLMs)领域取得显著进展的同时,尽管在输入端多模态理解方面取得了显著进展,但在多模态内容生成领域仍存在明显的空白。

  • 站长之家
  • 546 0
  • AI文生视频,会在明年迎来“GPT时刻”

    在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。

  • 微信公众号 AI新智能
  • 550 0
  • 腾讯视频推出弹幕引擎 “芯魔方” 实现弹幕效果画面内容高契合度

    腾讯视频为《南海归墟》第10集的弹幕体验推出了全新版本的弹幕引擎 “芯魔方”。

  • 站长之家
  • 729 0
  • 新AI框架DreamSync:结合图像理解模型的反馈 改善文本到图像合成

    来自南加州大学、华盛顿大学、巴伊兰大学和谷歌研究团队的研究人员推出了DreamSync,这是一种新型人工智能框架,致力于解决扩散型文本到图像(T2I)模型中对齐和审美吸引力的问题,而无需进行人工标注、修改模型架构或使用强化学习。

  • 站长之家
  • 721 0
  • 全新视频全景分割技术MaXTron

    MaXTron是一种专为视频分割而设计的先进的元架构,通过无缝集成片内和片间跟踪模块,提升了分割结果的时间一致性。

  • 站长之家
  • 674 0
  • 细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型

    MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。

  • 站长之家
  • 542 0
  • 研究显示图片生成模型比文本生成模型更耗电
    研究显示图片生成模型比文本生成模型更耗电

    12月6日消息,一支来自卡内基梅隆大学和 Hugging Face 的研究团队表示,不同的生成式 AI 模型在能耗方面也有不同的表现。

  • DoNews
  • 718 0
  • Animate Anyone引发人们对虚假视频泛滥的担忧

    随着阿里巴巴智能计算研究所开发的“Animate Anyone”技术的推出,图像生成视频的领域迈出了重要一步。

  • 站长之家
  • 661 0
  • Runway和Getty合作开发新生成式AI视频模型RGM 瞄准好莱坞和广告行业

    Runway ML与Getty Images的合作标志着AI视频领域的重要进展。这次合作将开发一个新的生成式AI视频模型,命名为Runway Getty Images Model(RGM),专注于服务好莱坞和广告等视觉媒体行业。

  • 站长之家
  • 611 0
  • -------------没有了-------------

    图赏更多>