科技魔方
  • AI视频
  • 创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景

    Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从而重建现实世界场景。

  • 站长之家
  • 634 0
  • 南洋理工大学研究人员推出研究人员发布Upscale-A-Video:利用文本提示提升视频超分辨率

    近日,新加坡南洋理工大学(NTU)的研究人员成功发布了一项名为"Upscale-A-Video"的视频超分辨率技术,通过开创性的文本引导潜在扩散方法,旨在提升低质量视频的视觉质量。

  • 站长之家
  • 519 0
  • 通用物体级基础模型GLEE:增强图像和视频分析

    近日,来自华中科技大学、字节跳动和约翰斯·霍普金斯大学的研究人员推出了一款名为GLEE的全新通用物体级别基础模型,为图像和视频分析带来了全新的可能性。

  • 站长之家
  • 611 0
  • AI生成视频:有点惊艳,有点离谱

    AI生成的视频,正在入侵互联网。

  • 微信公众号定焦
  • 568 0
  • 走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

    最近,有人在社交媒体上发布了一张有关GPT4.5更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5最大的惊喜可能就是处理3D 和视频的能力。

  • 微信公众号 机器之心
  • 596 0
  • 突破性AI方法WHAM:精确有效地预测视频中3D人体运动

    在最新的研究中,卡内基梅隆大学(CMU)和马克斯·普朗克智能系统研究所的研究人员共同发布了一项名为WHAM(World-grounded Humans with Accurate Motion)的创新性AI方法。这一方法在精准性和效率方面实现了从视频中准确估计3D人体运动的突破。

  • 站长之家
  • 578 0
  • 视频重绘工具DomoAI 不用SD视频一键就能转动漫

    DomoAI是一款AI艺术生成器,用户可以通过简单的操作,充分发挥他们的创造力,产生高质量、具有风格的视觉效果。

  • 站长之家
  • 661 0
  • 阿里图像生成视频模型I2VGen-XL代码发布

    阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。如今,他们终于发布了具体的代码和模型。

  • 站长之家
  • 702 0
  • 微软PowerPoint 网页版现在支持幕隐藏式字幕的视频

    根据 Windows Central 的报道,PowerPoint 网页版现在允许用户将带有隐藏式字幕和字幕的视频插入演示文稿中。

  • 站长之家
  • 711 0
  • 南洋理工发布提高AI视频生成内容一致性方法FreeInit

    南洋理工大学发布了一项名为FreeInit的方法,该方法可以大幅提高人工智能视频生成的内容一致性。演示显示这一方法非常流畅,并且可以与现有的SD生态结合。

  • 站长之家
  • 532 0
  • -------------没有了-------------

    图赏更多>