科技魔方
  • 大模型最新相关新闻
  • 月之暗面回应Kimi推出付费方案 目前为小范围灰度测试

    月之暗面最近推出了一项付费方案,名为Kimi的AI助手将提供不同价格和时长的服务选项。这些选项包括5.2元/4天,9.99元/8天,28.8元/23天,49.9元/40天,99元/93天,以及399元/365天的套餐。

  • 站长之家 月之暗面Kimi大模型
  • 652 0
  • 谷歌推出开源工具Model Explorer,助力AI透明度和问责制

    谷歌最新推出的开源工具Model Explorer承诺为这些系统的不透明性带来曙光,有望开启AI透明度和问责制的新时代。

    谷歌推3D生成模型CAT3D 1分钟完成3D场景创建

    谷歌推出的CAT3D模型在3D重建领域取得了显著的进展,它通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。

  • 站长之家 谷歌3D大模型
  • 522 0
  • 谷歌发布Gemini 1.5技术报告 详细介绍Gemini 1.5 Pro模型架构改进情况

    Google DeepMind 发布了一份长达150页的技术报告,详细介绍了Gemini1.5Pro 和 Gemini1.5Flash 两个模型的性能特点和架构以及这个多模态大型模型的最新进展。

  • 站长之家 谷歌Gemini大模型
  • 610 0
  • viva发布类Sora视频生成模型 支持4K分辨率

    海外产品viva近期推出了一个基于 Sora 架构的视频生成模型,这是首个向所有用户开放的同类工具,目前阶段免费使用。这一工具的发布对于希望快速制作视频内容的普通人来说是一个重大利好。

  • 站长之家 viva大模型视频Sora视频
  • 620 0
  • 索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型

    索尼音乐集团发出警告,禁止未经许可的公司使用其音乐数据训练大型AI模型。

  • 站长之家 索尼音乐大模型AI模型
  • 566 0
  • ChatGPT现在允许用户直接从 Google Drive、Microsoft OneDrive 导入文件

    OpenAI 本周宣布,其标志性大型语言模型(LL)ChatGPT 已更新,用户现可直接从外部云盘 Google Drive 和 Microsoft OneDrive 导入文件。该功能适用于 ChatG Plus、Team 和 Enterprise 用户,并可在使用新的 GPT-4o 模型以及

  • 站长之家 ChatGPT谷歌大模型
  • 681 0
  • 腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器

    在腾讯云生成式AI产业应用峰会上,腾讯公司展示了其最新的AI创新成果——腾讯元器。这是一个一站式的AI智能体创作与分发平台,它基于腾讯的混元大模型构建,为企业提供了一个全新的解决方案。

    谷歌发布开源视觉语言模型PaliGemma 支持多视觉语言任务

    谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。

  • 站长之家 谷歌大模型语言图像
  • 562 0
  • OpenAI CEO:GPT-5会很特别 可能类似于一个 “虚拟大脑”

    OpenAI首席执行官 Sam Altman 在接受采访时透露了 GPT-4o 和 GPT5的一些信息。GPT-4o 是一款多模态大模型,可以跨文本、视频和音频进行推理。Sam Altman表示,他早就有用语音控制计算机的想法,而 GPT-4o 的综合推理能力将

  • 站长之家 OpenAIGPT-5大模型
  • 698 0
  • 真免费不绑定,声智首推实时语音转写与多语翻译免费开放!
    真免费不绑定,声智首推实时语音转写与多语翻译免费开放!

    5月14日,OpenAI召开春季发布会发布基于GPT-4o打造的语音版ChatGPT,次日Google I/O大会正式召开,推出从基座模型 Gemini 升级到新的AI语音助手 Astra,标志着人机语音对话技术进入新的历史时刻。

  • 科技魔方
  • 618 0
  • Midjourney团队公布进展:视频模型进展较慢 3D模型和实时生成效果显著

    Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:

    Hume推出互动式AI播客Chatter 允许用户将搜索内容转换成语音播报

    Hume公司推出的EVI API新增了原生网页搜索功能的TTS(文本到语音)技术,允许用户通过网页搜索功能直接将网页内容转换成语音播报。同时,他们还推出了一款创新的互动式AI播客——Chatter。

  • 站长之家 Hume搜索AI大模型
  • 606 0
  • UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单

    UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。

  • 站长之家 UIUC大模型数据OpenAI
  • 549 0
  • 谷歌推出新的 AI 模型 LearnLM,专注于教育领域

    谷歌发布了它的新 AI 模型 LearnLM 将帮助学生解决作业问题。

  • 站长之家 谷歌大模型教育
  • 637 0
  • AI大模型重构高阶智驾 百度ASD将于极越车型量产首发
    AI大模型重构高阶智驾 百度ASD将于极越车型量产首发

    5月15日,百度Apollo在武汉举办Apollo Day 2024,其最前沿的智驾技术产品迎来焕新升级,命名为“ASD”(Apollo Self-Driving),并将在极越全系车型量产首发。

  • 科技魔方 AI大模型大模型百度
  • 560 0
  • 谷歌 I/O开发者大会汇总:AI模型全面更新 几乎覆盖所有生成模型类型

    昨晚的Google I/O发布会上,Google宣布了一系列AI模型的更新,涵盖了从文本到视觉和音乐的多个领域:

    字节跳动正式发布“豆包大模型”家族
    字节跳动正式发布“豆包大模型”家族

    今天上午,字节跳动在 2024 春季火山引擎 Force 原动力大会上正式宣布自家豆包大模型正式开启对外服务。

    基于Gemini大模型!谷歌宣布为安卓引入新功能:AI检测诈骗电话

    在今天凌晨举行的I/O开发者大会上,谷歌表示即将推出Android15,并且还剧透了一些新功能。

    Android 15即将推出:融入谷歌Gemini大模型

    谷歌在I/O大会上宣布,Android15已融入谷歌Gemini大模型,支持诸如AI语音助理防诈骗、画圈图片搜索、理解图片给出更符合用户需求的答案等功能,Android 15 Beta 2将在明天正式推出。

    谷歌硬刚GPT-4o,60秒视频生成模型虽迟但到,还把上下文窗口卷到了200万

    OpenAI出手再次惊艳世界,谷歌果然坐不住了。

  • 量子位公众号 谷歌大模型模型
  • 570 0
  • 谷歌正式发布Gemini 1.5 Flash大模型:轻量化、响应速度极快
    谷歌正式发布Gemini 1.5 Flash大模型:轻量化、响应速度极快

     今天凌晨,谷歌正式召开了I/O大会,宣布谷歌已全面进入Gemini时代。

    微软宣布 GPT-4o 模型在 Azure OpenAI 上使用

    日前,微软宣布OpenAI最新发布的多模态模型 GPT-4o 现已可以在 Azure OpenAI 云服务中使用。

  • 站长之家 微软大模型模型OpenAI
  • 603 0
  • 最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路

    在全球科技领域迎来又一次颠覆性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中

     932    1 2 3 4 5 6 7 8 9 10 下一页 尾页

    -------------没有了-------------

    图赏更多>