科技魔方
  • 技术
  • 谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征

    近期,Google Research和MIT CSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。

  • 站长之家 谷歌
  • 726 0
  • Github爆火AI语音克隆项目OpenVoice,精准进行声音复刻

    最近,Github上的一个名为OpenVoice的AI语音克隆项目爆火,该项目由myshell-ai开源,仅开源了不到三周,就有了6.1k的star。

  • 站长之家
  • 699 0
  • 文生图模型TrailBlazer:利用边界框控制视频对象轨迹

    在最近的文本到视频生成(T2V)方法中,实现合成视频的可控性通常是一个挑战。通常情况下,为了解决这个问题,需要提供低级别的每帧指导,如边缘图、深度图或待修改的现有视频。

  • 站长之家 文生图TrailBlazer
  • 720 0
  • AI视频何时才能跑出一个“Midjourney”?

    AI视频一跃成为“明日之星”,大厂和创业公司们打得热火朝天。

  • 微信公众号光锥智能 AI视频
  • 553 0
  • 科学期刊将引入AI工具Proofig检测图片欺诈

    日前,科学期刊Science宣布其所有期刊将开始使用商业软件,自动检测不当篡改的图像。

  • 站长之家
  • 573 0
  • Wild2Avatar可逼真渲染视频中被遮挡的人物

    在渲染移动人物的视觉外观时,面对摄像头视野被遮挡的问题是一项巨大的挑战。

  • 站长之家
  • 608 0
  • Robin AI融资2.6亿美元,推动AI法律合同解决方案全球化

    英国公司Robin AI最近宣布成功完成了一笔规模为2.6亿美元的B轮融资,使其总融资额接近4.3亿美元。

  • 站长之家 RobinAI
  • 726 0
  • Midjourney训练AI使用的艺术家数据库名单泄露引发争议
    Midjourney训练AI使用的艺术家数据库名单泄露引发争议

    根据最新报道,用于训练Midjourney的生成式人工智能(AI)程序的艺术家数据库已泄露,引起社交媒体和艺术界的广泛争议。泄露的名单中包括一些知名艺术家,如Banksy、David Hockney等。

  • 站长之家
  • 619 0
  • 视觉编码器VCoder:提高模型在识别图像方面的能力

    VCoder是一个视觉编码器,旨在提高多模态语言模型(MLLM)在识别图像中的对象和理解图像场景方面的能力。它能够帮助模型更好地理解和分析图像内容。

  • 站长之家 视觉编码器VCoder
  • 644 0
  • 微软研究人员推新AI方法,用合成数据改进高质量文本嵌入
    微软研究人员推新AI方法,用合成数据改进高质量文本嵌入

    微软公司的研究团队最近提出了一种独特且简单的方法,用于生成高质量的文本嵌入。这种新方法仅使用合成数据和极少的训练步骤(少于1,000步),就取得了令人瞩目的成果。

  • 站长之家 微软AI
  • 635 0
  • -------------没有了-------------

    图赏更多>