科技魔方
  • 研究方向
  • AI 声音克隆引发版权争议,美国唱片业协会要求政府干预

    美国唱片业协会(RIAA)认为人工智能(AI)声音克隆是一种潜在的侵犯版权的威胁,要求美国政府将其列入盗版监督名单。

  • IT之家
  • 645 0
  • 全新图文生成方式MiniGPT-5 生成文本的同时创作匹配的图片

    MiniGPT-5是一款基于大型语言模型的视觉与语言生成工具,旨在实现图像和文本的协同生成。它采用了创新的"生成vokens"概念,作为实现图像和文本协同生成的桥梁。

  • 站长之家
  • 553 0
  • StreamingLLM 框架问世,号称“可让大模型处理无限长度文本”

    麻省理工学院联合 Meta AI 的研究人员日前开发了一款名为 StreamingLLM 的框架,为大语言模型可能遇到的 RAM 与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。

  • IT之家
  • 613 0
  • Wayve推出GAIA-1 9B,通过生成合成视频训练自动驾驶

    英国初创公司Wayve在2023年6月发布了GAIA-1(Generative Artificial Intelligence for Autonomy),这是一款为自动驾驶车辆培训数据而设计的生成式模型。GAIA-1的最新版本,GAIA-19B,已经取得了令人瞩目的进展。

  • 站长之家
  • 566 0
  • 创新免费AI视频创作工具Show-1,仅占普通模型25%GPU内存

    新加坡国立大学的研究团队最近成功研发了一款名为Show-1的AI系统,该系统可以将文本描述转化为高质量视频。这一突破性的技术在AI领域引起了广泛的关注,被誉为最佳的免费AI视频创作工具之一。

  • 站长之家
  • 600 0
  • AI视频生成框架AnimateDiff 一键从文本到动画

    AnimateDiff 是一款强大的工具,它允许您轻松地将文本转化为动画图像,而无需特定的调整。它为用户提供了无限的创意和探索空间,让您可以将文本描述转化为令人惊叹的动画场景。

  • 站长之家
  • 1044 0
  • 修复视频新神器BSCV工具集 为视频修复技术开辟新可能

    在过去十年中,视频修复技术取得了显著进展,但对于常见问题如直播视频的修复效果不尽理想。

  • 站长之家
  • 684 0
  • 多模态大模型KOSMOS-2.5 擅长处理文本密集图像
    多模态大模型KOSMOS-2.5 擅长处理文本密集图像

    随着视觉与语言的深度融合,文本图像理解成为多模态领域的新方向。文章介绍了一个突破性的多模态模型KOSMOS-2.5,它在处理文本密集图像上展现强大能力。

  • 站长之家
  • 561 0
  • Meta发布AI聊天机器人 能生成文本回复及图像

    日前,Meta 宣布推出测试版的聊天机器人Meta AI,Meta AI能生成文本回复及图像,利用了Llama 2的技术和最新的大型语言模型研究,在基于文本的聊天中,Meta AI可以通过与微软必应搜索引擎的合作获得实时信息。

  • DoNews
  • 616 0
  • 好说 AI 视频换脸功能上新,保姆级教程记得收藏!

    马上就要到国庆假期咯!大家期待的心情是不是已经达到了顶峰呢? 在此之前,「好说 AI」功能上新啦!AI 视频换脸功能新鲜出炉~

  • 极客网
  • 651 0
  • -------------没有了-------------

    图赏更多>