科技魔方
  • 研究方向
  • Capsule:AI驱动的视频编辑利器
    Capsule:AI驱动的视频编辑利器

    Capsule是一个采用人工智能技术的视频编辑器,专为内容和营销团队设计。它可以帮助用户快速制作惊艳的视频,轻松协作,并保持品牌一致性。

  • 站长之家
  • 693 0
  • 微软专利提出可扩展动态合成声音技术,通过多层优化实现高效HRTF效果
    微软专利提出可扩展动态合成声音技术,通过多层优化实现高效HRTF效果

    头相关传递函数HRTF如何得到适当的实现,诸如HoloLens这样的系统可以产生来自特定位置的逼真虚拟音效。然而,HRTF的计算量十分高昂,所以现有系统会尝试近似HRTF。

  • 映维网
  • 551 0
  • 纽约大学基于HoloLens 2开发AR+AI虚拟助手,提供及时音视频反馈
    纽约大学基于HoloLens 2开发AR+AI虚拟助手,提供及时音视频反馈

    如果你学过做饭,你就会知道这对新人而言并不简单。但想象一下,如果你有一个人来帮助你,比如说一个人工智能助手可以指导你完成所有你需要知道的事情和完成的动作,这将能确保你没有任何遗漏,并协助你享受一顿没有压力的美味晚餐。

  • 映维网
  • 648 0
  • Pika Labs AI视频生成器现在可以嵌入文字和图像了

    最近,PikaLabs在Discord上部署的AI视频生成器增加了两项新功能。

  • 站长之家
  • 803 0
  • 在线视频实例分割技术TCOVIS 可保持时间一致性

    研究人员介绍了一种名为TCOVIS的在线视频实例分割技术,该技术注重时间一致性。实例分割是计算机视觉领域的一个热门研究课题,其目标是将视频帧中的每个独立实例进行识别和分割。

  • 站长之家
  • 640 0
  • Rerender A Video源代码放出!解决AI视频闪烁问题

    Rerender A Video是一项令人印象深刻的技术成果,它旨在将大型文本到图像扩散模型的能力扩展到视频领域。

  • 站长之家
  • 653 0
  • 一帧秒创:支持图文转视频,AI数字人等功能
    一帧秒创:支持图文转视频,AI数字人等功能

    一帧秒创是一款基于秒创AIGC引擎的智能AI内容生成平台,旨在为创作者和机构提供多种AI生成服务,包括文字续写、文字转语音、文生成图、图文转视频等多项创作服务。

  • 站长之家
  • 613 0
  • Spotify 将使用 OpenAI 人工智能技术克隆播客声音 并将其翻译成其他语言

    Spotify正在测试一种新的方式,让播客主持人使用人工智能技术,以自己的声音模拟不同语言版本,以便触达其他语言的听众。

  • 站长之家
  • 551 0
  • ChatGPT重磅升级:可以看图、听声音、说话啦!

    美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。

  • 微信公众号 AIGC开放社区
  • 665 0
  • Genmo AI可3秒作画成图并且生成视频

    Genmo是一款基于人工智能的创意产品,可以通过语言描述自动生成视频、图像、3D模型等创意内容。

  • 站长之家
  • 797 0
  • -------------没有了-------------

    图赏更多>