Gemma 3 – Google 推出的轻量级、高性能开源模型

1,222 0 0

Gemma 3是什么？

Gemma 3 是 Google 推出的轻量级、高性能开源模型，支持多种尺寸（1B、4B、12B 和 27B），专为单 GPU 或 TPU 设计。它支持 140 多种语言，具备高级文本和视觉推理能力，配备 128k-token 上下文窗口和函数调用功能，支持复杂任务处理。Gemma 3 提供量化版本，优化性能，降低计算需求，并配备安全特性。它无缝集成多种开发工具，支持灵活部署，助力开发者快速构建高效 AI 应用。

Gemma 3的主要特点

高性能单加速器模型：Gemma 3 在其尺寸类别中性能卓越，优于 Llama-405B、DeepSeek-V3 等模型，适合在单个 GPU 或 TPU 上运行，帮助开发者创建高效应用。
多语言支持：支持超过 140 种语言，包括 35 种开箱即用语言和 140 多种预训练语言，助力开发者构建全球化应用。
高级文本和视觉推理能力：支持图像、文本和短视频分析，为交互式和智能应用提供新可能性。
扩展上下文窗口：提供 128k-token 的上下文窗口，支持处理和理解大量信息。
函数调用支持：支持函数调用和结构化输出，帮助自动化任务并构建智能工作流。
量化版本：提供官方量化版本，减少模型大小和计算需求，同时保持高精度。
安全特性：配备严格的安全协议，包括数据治理、微调和基准测试评估，确保模型的负责任使用。
图像安全检查：推出 ShieldGemma 2，支持危险内容、色情和暴力的分类，提供图像安全检查解决方案。
灵活集成：支持 Hugging Face Transformers、Ollama、JAX、Keras、PyTorch 等多种工具，无缝集成到现有工作流中。
优化性能：在 NVIDIA GPU 和 Google Cloud TPU 上优化，支持 AMD GPU 和 CPU 执行，提供多种部署选项。

Gemma 3的模型表现

单加速器性能卓越：Gemma 3 27B 在 Chatbot Arena Elo 分数测试中排名第二，仅次于 DeepSeek-R1，超越了 Llama-405B、DeepSeek-V3 和 OpenAI 的 o3-mini。
推理效率高：在单张 NVIDIA H100 GPU 上，Gemma 3 27B 的推理速度达到每秒 112 个 token，比 Llama-405B 高出 18%。
长上下文处理能力强：支持 128k-token 上下文窗口，远超 Llama-405B 的 8k 和 DeepSeek-V3 的 32k。
多模态能力：支持文本、图像和短视频输入，12B 版本在图像描述任务中准确率达 92%，27B 版本的物体识别 F1 分数高达 0.89。