科技魔方
  • 研究方向
  • ElevenLabs宣布将上线AI音效功能 可给Sora生成的视频配音

    这个春节AI界炸了!Sora的惊艳亮相,在业内荡起了千层浪。

  • 站长之家
  • 655 0
  • Meta首发AI视频模型V-JEPA 可用人类的理解方式看世界

    近日,深度学习领域泰斗LeCun在WGS峰会上怒斥Sora模型不能真正理解物理世界,引起广泛关注。

  • 站长之家 MetaAI
  • 560 0
  • 要颠覆配音方式,微软获批新专利:AI 提取声纹细腻演绎
    要颠覆配音方式,微软获批新专利:AI 提取声纹细腻演绎

    IT之家2 月 8 日消息,根据美国商标和专利局(USPTO)近日公示的清单,微软获得了一项新的技术专利,表明微软正在涉足配音工具领域,目的是彻底改变用户配音的方式。

  • IT之家
  • 651 0
  • RAGatouille:几行代码搞定 让你轻松玩转SOTA检索模型ColBERT

    在信息检索中,创建有效的管道,尤其是使用RAG(Retrieval-Augmented Generation)的管道,可能是相当具有挑战性的。这些管道涉及各种组件,选择检索模型至关重要。

  • 站长之家 RAGatouille模型ColBERT
  • 625 0
  • 视频生成模型Stable Video Diffusion1.1发布 清晰度质量有所改进

    Stable Video Diffusion (SVD) 模型1.1已经发布,通过测试视频展示了其令人瞩目的性能。SVD1.1模型是一个生成图像到视频的扩散模型,通过对静止图像的条件化生成短视频。

  • 站长之家
  • 661 0
  • MIT最新研究:纯文本模型也能训练出视觉表征 用代码就能作画
    MIT最新研究:纯文本模型也能训练出视觉表征 用代码就能作画

    最近,MIT计算机科学与人工智能实验室的研究人员进行了一项有趣的研究,通过评估语言模型的视觉能力,揭示了纯文本模型训练视觉概念表征的新可能性。

  • 站长之家
  • 663 0
  • 小红书博主用AI制作文旅宣传片 点赞超39万

    近日,一些博主利用AI为家乡文旅景区制作创意视频,成为旅游营销的新热潮。通过通义千问APP的“全民舞王”应用,博主们成功制作出引人注目的宣传视频。

  • 站长之家
  • 534 0
  • 文本生成高清、连贯视频,谷歌推出时空扩散模型

    谷歌研究人员推出了创新性文本生成视频模型——Lumiere。

  • 微信公众号 AIGC开放社区
  • 669 0
  • 抖音官方下场做AI直播切片 第三方团队或加速淘汰

    “小杨哥直播全程高能,哈登为带货速度惊掉下巴……”

  • 微信公众号 直播观察
  • 529 0
  • 正交微调解锁文本创建逼真图像新能力 实现对生成图像的精确控制

    一直以来,基于文本的图像生成技术一直备受关注,因为它能够根据文字描述创建逼真的图像。这些模型利用复杂的算法解读文本并将其转化为视觉内容,模拟了人类独有的创造力和理解能力。

  • 站长之家
  • 576 0
  • -------------没有了-------------

    图赏更多>