Gemini 2.5 Flash:谷歌推出的首个完全混合推理模型

AI工具1周前更新 AI小助手
79 0
讯飞智文

Gemini 2.5 Flash 是什么?

Gemini 2.5 Flash 是 Google 推出的首个完全混合推理模型,允许开发人员灵活控制模型的思考功能,可开启或关闭。它还支持设置思考预算,帮助开发者在质量、成本和延迟之间找到最佳平衡。即使关闭思考功能,模型仍能保持 2.0 Flash 的高速度,并进一步提升性能,兼具高效推理和成本效益。目前处于预览阶段,支持通过 API 在 Google AI Studio 和 Vertex AI 中使用。

Gemini 2.5 Flash:谷歌推出的首个完全混合推理模型

Gemini 2.5 Flash 的主要特性

  • 混合推理能力:Gemini 2.5 Flash 支持开启或关闭思考功能,即使关闭思考,仍能保持快速响应。
  • 推理预算控制:开发者可设置思考预算,灵活调整推理深度,平衡质量、成本和延迟。
  • 高性价比:在性能与成本的权衡上表现出色,以较低成本实现与其他领先模型相当的性能。
  • 推理能力提升:在需要多步推理的复杂任务上表现出色,能够生成更准确和全面的答案。
  • 灵活的 API 支持:通过 Google AI Studio 和 Vertex AI 提供 API 接口,方便开发者集成和使用。

Gemini 2.5 Flash 性能表现

在 GPQA 知识问答中,24k 思考预算下性能提升了6%;在 LiveCodeBench 代码任务中,16k 思考预算下性能最佳。在大模型排行榜中,Gemini 2.5 Flash 以1392 ELO 高分位居第二,与 GPT-4.5-preview、Grok 3 并驾齐驱。

Gemini 2.5 Flash:谷歌推出的首个完全混合推理模型

如何使用Gemini 2.5 Flash ?

Gemini 2.5 Flash 现已通过 Google AI Studio Vertex AI 中的 Gemini API 以及 Gemini 应用程序中的专用下拉菜单提供预览版。

© 版权声明
Trae

相关文章

暂无评论

none
暂无评论...