Gemma 3 – Google 推出的轻量级、高性能开源模型

AI工具5小时前更新 AI小助手
82 0
清影AI视频生成

Gemma 3是什么?

Gemma 3 是 Google 推出的轻量级、高性能开源模型,支持多种尺寸(1B、4B、12B 和 27B),专为单 GPU 或 TPU 设计。它支持 140 多种语言,具备高级文本和视觉推理能力,配备 128k-token 上下文窗口和函数调用功能,支持复杂任务处理。Gemma 3 提供量化版本,优化性能,降低计算需求,并配备安全特性。它无缝集成多种开发工具,支持灵活部署,助力开发者快速构建高效 AI 应用。

Gemma 3 - Google 推出的轻量级、高性能开源模型

Gemma 3的主要特点

  • 高性能单加速器模型:Gemma 3 在其尺寸类别中性能卓越,优于 Llama-405B、DeepSeek-V3 等模型,适合在单个 GPU 或 TPU 上运行,帮助开发者创建高效应用。
  • 多语言支持:支持超过 140 种语言,包括 35 种开箱即用语言和 140 多种预训练语言,助力开发者构建全球化应用。
  • 高级文本和视觉推理能力:支持图像、文本和短视频分析,为交互式和智能应用提供新可能性。
  • 扩展上下文窗口:提供 128k-token 的上下文窗口,支持处理和理解大量信息。
  • 函数调用支持:支持函数调用和结构化输出,帮助自动化任务并构建智能工作流。
  • 量化版本:提供官方量化版本,减少模型大小和计算需求,同时保持高精度。
  • 安全特性:配备严格的安全协议,包括数据治理、微调和基准测试评估,确保模型的负责任使用。
  • 图像安全检查:推出 ShieldGemma 2,支持危险内容、色情和暴力的分类,提供图像安全检查解决方案。
  • 灵活集成:支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等多种工具,无缝集成到现有工作流中。
  • 优化性能:在 NVIDIA GPU 和 Google Cloud TPU 上优化,支持 AMD GPU 和 CPU 执行,提供多种部署选项。

Gemma 3的模型表现

Gemma 3 - Google 推出的轻量级、高性能开源模型
  • 单加速器性能卓越:Gemma 3 27B 在 Chatbot Arena Elo 分数测试中排名第二,仅次于 DeepSeek-R1,超越了 Llama-405B、DeepSeek-V3 和 OpenAI 的 o3-mini。
  • 推理效率高:在单张 NVIDIA H100 GPU 上,Gemma 3 27B 的推理速度达到每秒 112 个 token,比 Llama-405B 高出 18%。
  • 长上下文处理能力强:支持 128k-token 上下文窗口,远超 Llama-405B 的 8k 和 DeepSeek-V3 的 32k。
  • 多模态能力:支持文本、图像和短视频输入,12B 版本在图像描述任务中准确率达 92%,27B 版本的物体识别 F1 分数高达 0.89。

Gemma 3的适合人群

  • 开发者:希望在资源受限的设备上运行高性能 AI 模型的开发者。
  • 企业用户:需要快速部署 AI 应用并支持多语言的团队。
  • 研究人员:通过 Gemma 3 学术计划申请 Google Cloud 信用额度,加速研究。
  • AI 创新者:利用 Gemma 3 构建具有高级推理和自动化能力的应用。

Gemma 3的资源地址

© 版权声明

相关文章

暂无评论

none
暂无评论...