科技魔方

谷歌宣称Gemma 3是“最好的单加速器AI”

更多动态

2025年03月13日

  在首批Gemma AI模型发布一年多后,谷歌推出了Gemma 3,专为开发多功能AI应用程序的开发人员而设计。这些模型支持超过35种语言,可以在从手机到工作站的各种设备上运行,具有分析文本、图像和短视频的功能。

  谷歌声称Gemma 3是“世界上最好的单加速器模型”,与Facebook的Llama、DeepSeek和OpenAI等竞争对手相比,其性能更胜一筹,尤其是在使用单个GPU的主机上。新模型的视觉编码器有所增强,支持高分辨率和非方形图像。此外,谷歌还推出了Shield Gemma 2,这是一款图像安全分类器,能够过滤被归类为色情、危险或暴力的内容。

  尽管最初对此类模型的兴趣尚不确定,但DeepSeek等替代方案的流行表明对硬件要求较低的AI技术的需求。谷歌提到,Gemma 3增强的STEM性能经过评估,以评估其在制造有害物质方面被滥用的可能性,并得出低风险等级的结论。

  在人工智能模型的背景下,“开放”或“开源”的含义仍存在争议。谷歌对Gemma的许可限制了使用,这一政策在新版本中继续有效。该企业通过Google Cloud积分推广Gemma,允许研究人员通过Gemma 3学术计划申请10000美元的积分来促进其研究。

  根据谷歌博客,Gemma模型系列旨在让人工智能技术广泛普及。在该模型发布一周年之际,下载量超过1亿次,创建了60000多个变体,谷歌推出了Gemma 3,这是一套基于其Gemini 2.0技术构建的轻量级高级模型。Gemma 3的大小为1B、4B、12B和27B,使用户能够根据其硬件和性能要求选择最佳模型。

  Gemma 3功能和集成

  Gemma 3为开发人员提供了多项新功能。它提供了最先进的性能,在LMArena排行榜的早期评估中超越了Llama-405B、DeepSeek-V3和o3-mini。开发人员可以创建以35多种语言运行的应用程序,并为140多种语言提供预训练支持。该模型通过分析图像、文本和短视频来促进高级推理。

  Gemma 3具有128k令牌上下文窗口,允许应用程序处理大量信息,并支持函数调用以自动执行任务。它还引入了量化模型,可在保持准确性的同时减少尺寸和计算需求。

  Gemma 3与流行的开发工具集成良好,包括Hugging Face Transformers、Ollama、JAX、Keras、PyTorch等。开发人员可以通过Google AI Studio立即访问模型,也可以从Kaggle和Hugging Face等平台下载模型。经过改进的代码库允许在各种环境中进行自定义和微调,同时提供多种部署选项,包括Vertex AI和Google GenAI API。

  NVIDIA优化了Gemma 3模型,确保在各种GPU尺寸上均具有高性能。这些模型还设计为通过开源ROCm™堆栈与Google Cloud TPU和AMD GPU兼容。

  借助Gemma 3,Google设想了一个“Gemmaverse”,即一个由社区驱动的工具和模型组成的广泛生态系统。例如,AI Singapore的SEA-LIONv3增强了东南亚地区的通信,而INSAIT的BgGPT支持保加利亚语,Nexa AI的OmniAudio则展示了先进的音频处理技术。

  为了支持学术研究,谷歌推出了Gemma 3学术计划,为入选研究人员提供10000美元的Google Cloud积分。申请期从今天开始,为期四周。

  开发人员可以通过Google AI Studio探索Gemma 3,并通过Google GenAI SDK使用它,或将其与各种开发环境集成。凭借其一系列功能和广泛的集成,Gemma 3旨在进一步普及先进的AI技术。

+1

来源:千家网

延展资讯