科技魔方
  • 技术
  • 香港大学和微软推高效声音转换方法CoMoSVC 歌声随意切换
    香港大学和微软推高效声音转换方法CoMoSVC 歌声随意切换

    CoMoSVC是一种能够将一个人的歌声转换成另一个人的歌声的创新技术。这个项目是由香港大学和微软亚洲研究员共同开发的,它在高质量音频转换和快速处理速度之间找到了平衡,是语音转换领域的重大进步。

  • 站长之家
  • 626 0
  • Meta AI发布炸裂项目audio2photoreal 可将音频生成全身逼真的虚拟人物形象

    MetaAI最近发布了一项引人注目的技术,他们成功地开发出一种能够从音频中生成逼真的虚拟人物形象的系统。

  • 站长之家 MetaAI
  • 584 0
  • 用大模型读取你的想法,并转化成文本!恐怖的DeWave模型

    悉尼科技大学的科研人员,通过大语言模型、EEG(大脑活动检测工具)、脑机接口等技术,开发了一个可自动读取人类想法,并转化成文本的AI大模型——DeWave。

  • 站长之家
  • 693 0
  • Pile:一款内置OpenAI API的AI日记软件

    Pile是一款非常整洁美观的开源AI日记软件。它不仅可以帮助你撰写和保存日记条目,记录你的思考和经历,还可以作为备忘录使用。Pile内置了OpenAI的API功能,让你可以通过写下提示词来扩展你的想法和日记内容。

  • 站长之家
  • 656 0
  • Meta 新模型:如果我每14秒生成一个高清视频,好莱坞的各位要如何应对|「变压器」

    利用人工智能来合成视频一直是该领域的难题,因为其中最关键的一环——映射与合成,缺乏优秀的模型算法,只能利用卷积神经网络(CNN)和生成对抗网络(GAN)来不断提取特征、生成、判断,直至最后结果。

  • 微信公众号硅星人Pro 模型
  • 599 0
  • 三星Galaxy S24 AI 将开启类似于 Note、可折叠设备的“移动新时代”

    随着三星即将于1月17日推出Galaxy S24系列,一场以人工智能为主题的“移动新时代”正式拉开序幕。在最新的预告片中,三星通过回顾自家手机的历史,强调了其在塑造手机演进方面的关键作用。

  • 站长之家
  • 586 0
  • 面部图像修复突破性AI方法Dual-Pivot Tuning 实现人脸模糊变高清

    图像修复一直是一个备受研究者关注的复杂挑战,其主要目标是在维持降质输入的感知质量的同时,创建视觉上吸引人且自然的图像。在没有有关主题或降质的信息的情况下(盲目恢复),了解自然图像范围至关重要。

  • 站长之家
  • 596 0
  • 清华、浙大推GPT-4V开源平替!LLaVA、CogAgent等开源视觉模型大爆发
    清华、浙大推GPT-4V开源平替!LLaVA、CogAgent等开源视觉模型大爆发

    近期,GPT-4V的开源替代方案在中国的顶尖学府清华、浙大等的推动下,出现了一系列性能优异的开源视觉模型。其中,LLaVA、CogAgent和BakLLaVA是三种备受关注的开源视觉语言模型。

  • 站长之家
  • 691 0
  • 马斯克预言:2024年世界将更加疯狂 AI电影明年就会来了

    周一,美国时间,X平台上有一位网友发出了这样的疑问:“ 2024 年我们还能享受一个正常的生活吗?在经历了四年的乱象之后,我们难道不该有这样的权利吗?”对此,马斯克回应说,“我觉得 2024 年会更加混乱。”

  • 站长之家
  • 700 0
  • 科技部发文规范AI使用 科研人员禁用AIGC直接生成申报材料

    据科学技术部消息,科技部监督司近日编制印发《负责任研究行为规范指引(2023)》,提出不得使用生成式人工智能(AIGC)直接生成申报材料,不得将生成式人工智能列为成果共同完成人,同时强调科研人员应把科技伦理要求贯穿到研究活动的全过程。

  • 站长之家
  • 667 0
  • -------------没有了-------------

    图赏更多>