科技魔方

谷歌发布多模态大模型Gemini 1.0 预计明年初向开发者推出

大模型

2023年12月07日

  Gemini 是 Google 推出的最新一代 AI 模型,Gemini 具有多模态的能力,可以处理和结合文本、代码、音频、图像和视频等不同类型的信息。

  Gemini 分为三种规模:Ultra、Pro 和 Nano,分别针对不同的复杂任务和设备。

  Gemini Ultra——最大、最有能力的模型,适用于高度复杂的任务。

  Gemini Pro——可扩展各种任务的最佳模型。

  Gemini Nano——最高效的模型,适用于设备任务

微信截图_20231207082511.png

  Gemini 在性能方面表现出色,超越了当前领先的大型语言模型研究中的30项常用基准测试中的30项。其中,在 "MMLU"(大规模多任务语言理解)基准测试中,Gemini Ultra 的得分达到了90.0%,首次超过人类专家的水平。Gemini 还在多模态基准测试中取得了优异的成绩,显示出其出色的多模态能力。

  Gemini 具备先进的多模态推理能力,能够从复杂的文本和视觉信息中提取洞察力,并能够理解和回答与复杂主题相关的问题。此外,Gemini 还在编码方面表现出色,能够理解和生成高质量的代码。

  Gemini 已经开始在 Google 产品中应用,包括 Bard 和 Pixel 系列。开发者和企业客户也可以通过 Gemini API 在 Google AI Studio 或 Google Cloud Vertex AI 中使用 Gemini Pro。

  Gemini Ultra 目前正在进行严格的安全检查,计划在明年初向开发者和企业客户推出。

微信截图_20231207082419.png

+1

来源:站长之家

延展资讯