科技魔方
  • 更多场景
  • 在富岳超算上训练大模型,日本联合研究团队发布Fugaku-LLM

    由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。

    新一代多模态内容生成模型Lumina-T2X 生成质量更高,成本更低

    Lumina-T2X 是一个创新的内容生成系列模型,它采用了统一的 DiT(Diffusion Model)架构,能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。

  • 站长之家 大模型文本图像视频
  • 642 0
  • 消息称三星停止自动驾驶研究 开发人员转到机器人领域

    BusinessKorea 网站援引业内人士消息,三星电子已停止自动驾驶汽车研究,负责三星中长期发展的三星先进技术研究院(SAIT),已经将自动驾驶排除在研究项目之外,将开发人员转移到机器人领域,作为三星中长期发展的一部分。

  • IT之家
  • 651 0
  • 品赛博烟火,算人间命数:机器人制造商 Kevin McAleer 推出树莓派算命机

    机器人制造商兼博主 Kevin McAleer 近日使用树莓派制造了一款算命机,这款算命机融合了赛博风格与复古设计,有点像《荒野大镖客:救赎 2》中的 19 世纪场景物件遇上了一台现代热敏纸打印机。

  • IT之家
  • 624 0
  • 硬刚OpenAI与谷歌?微软偷偷自研出5000亿参数大模型!

    在AI领域,微软公司一直以其独到的创新性和前瞻性而闻名。也正因此,它抢先在AI赛道嗅到商机,并极具预判性的投资了OpenAI,使其成为自己在AI赛道上的最强助力。

    StyleMamba:一种高效的文本驱动图像风格转换的ai模型

    近期,来自伦敦帝国理工学院和戴尔的研究团队推出了 StyleMamba,这是一种有效的框架,用于转移图片风格,通过使用文本来指导风格化过程,同时保持原始图像内容。

  • 站长之家 StyleMamba大模型图像
  • 656 0
  • 开源版EMO?AniTalker可通过照片加音频生成说话视频

    AniTalker是一个创新的开源项目,它能够通过静态肖像画和输入的音频信号生成生动的面部说话视频。

  • 站长之家 开源AniTalker音频视频
  • 688 0
  • AI 音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划

    AI 音乐初创公司 Udio 推出了几项新功能,包括音频修复和更长的上下文口,以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。

  • 站长之家
  • 659 0
  • Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索

    SiriUltra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。

  • 站长之家 SiriUltra大模型语言模型
  • 608 0
  • AI音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划

    AI 音乐初创公司 Udio 推出了几项新功能,包括音频修复和更长的上下文口,以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。

    -------------没有了-------------

    图赏更多>