科技魔方
  • 研究方向
  • 智谱 AI 开源视觉语言模型 CogAgent 支持GUI图形界面问答

    智谱 AI 开源了 CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在 GUI 理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。

  • 站长之家
  • 670 0
  • 2024年最重要AI图引热议 开源AI模型正在超越专有模型
    2024年最重要AI图引热议 开源AI模型正在超越专有模型

    近期,一张被称为「2024年最重要的AI图之一」的图表引起热议,展示了开源本地模型超越大规模云模型的趋势。

  • 站长之家
  • 584 0
  • Creatify:用AI做视频广告 便宜且高效

    Creatify是一个使用人工智能技术生成高质量营销视频的应用程序。用户只需输入产品链接或上传相关描述和图片,Creatify即可生成引人注目的视频广告。

  • 站长之家
  • 561 0
  • Ludo.ai 为游戏开发者推出文生视频生成器工具:快速创建游戏概念视频

    Ludo.ai 已经在游戏开发工具中整合人工智能(AI)三年,现在正通过创造一个文本到视频生成器工具为游戏开发者利用生成型 AI。

  • 站长之家
  • 602 0
  • AI视频类工具又出黑马!Tonic可自动选择并转换视频中的片段

    近日,一款名为Tonic的AI视频平台引起不少用户的关注,它在结合AI视频和内容消费方面表现出色。

  • 站长之家
  • 558 0
  • 谷歌推大语言模型VideoPoet:文本图片皆可生成视频和音频

    Google Research最近发布了一款名为VideoPoet的大型语言模型(LLM),旨在解决当前视频生成领域的挑战。该领域近年来涌现出许多视频生成模型,但在生成连贯的大运动时仍存在瓶颈。

  • 站长之家
  • 615 0
  • 微软Copilot新增重磅功能!文本直接生成超逼真音乐

    12月20日,微软在官网宣布与文生音乐领导者Suno合作,将其功能集成在copilot中,用户通过文本就能生成摇滚、流行、古典、朋克、民谣等多种类型音乐。

  • 微信公众号 AIGC开放社区
  • 587 0
  • 万人试用AI新应用:真人视频转动漫、像素风,从未如此丝滑

    视频的次元壁就这么被打破了。

  • 微信公众号 机器之心
  • 718 0
  • ​数字地图公司TomTom与微软合作开发基于人工智能的车载对话助手

    数字地图专家 TomTom 周二表示,该公司与科技巨头微软合作,共同开发了一款基于人工智能的车载对话助手。该助手可以让用户与车辆进行自然对话,并实现与信息娱乐、位置搜索和车辆控制系统的语音交互。

  • 站长之家
  • 708 0
  • -------------没有了-------------

    图赏更多>