GE

Gemini 2.5 Flash-Preview-09-2025

Gemini 2.5 Flash-Preview-09-2025

发布时间: 2025-09-25428
模型参数
未披露
上下文长度
1000K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
1000K tokens
最大输出长度
65536 tokens
模型类型
暂无数据
发布时间
2025-09-25
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址

官方介绍与博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.3$2.5
图片$0.3--

评测得分

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
54
54 / 72

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveBenchthinking
68.20
25 / 52

发布机构

模型解读

Gemini 2.5 Flash 09-2025 是 Google 推出的 Gemini 2.5 Flash 模型的最新公开预览版本,它专注于在保持高效低成本的同时,显著提升模型的智能和应用能力。

核心改进亮点

此版本模型主要在以下两个关键领域实现了显著提升:

1. 强大的 Agentic 工具使用能力

模型的智能体(Agentic)能力和工具调用(Tool Use)性能得到加强,使其在更复杂、多步骤的应用场景中表现更出色:

  • 基准性能飞跃: 在关键的 Agentic 基准测试中,模型性能有明显提升,尤其在 SWE-Bench Verified 测试中,相比上一版本实现了 5% 的增益
  • 长程任务提升: 早期测试者反馈,在内部的长跨度 Agentic 任务中,模型性能实现了 15% 的显著飞跃

2. 更高的效率和更低的成本

Gemini 2.5 Flash 09-2025 版本在开启“思考(Thinking)”功能时,实现了更高的成本效益:

  • Token 效率提升: 模型现在能以更少的 Token 获得更高质量的输出,从而降低延迟和成本。具体来说,相比于之前的版本,输出 Token 减少了 24%
  • 成本效益最佳: 新版本进一步巩固了 Gemini 2.5 Flash 作为“性价比之王”的地位。

其他重要特性与应用场景

Gemini 2.5 Flash 系列作为一款功能全面的“主力模型(workhorse model)”,具备以下特性:

  • 内置思考能力: 具有推理能力的模型,能够在生成回复前进行“思考”和推理,从而提高性能和准确性。开发者可以通过 API 参数动态控制“思考预算”,根据需求权衡成本、速度与智能水平。
  • 多模态能力增强: 能够更好地理解、解释、组织或总结上传的精细图像或图表内容。
  • 输出格式优化: 模型的回复组织和格式得到改进,能更好地使用标题、列表和表格等元素,使复杂的输出更清晰、易于阅读。
  • 推荐用途: 适用于大规模处理、低延迟、高并发量的任务,尤其是需要推理和 Agentic 能力的用例。它特别擅长高级推理、编码、数学和科学任务。
  • 工具支持: 支持全套原生工具,包括 Function Calling(函数调用)、Code Execution(代码执行)、Google Search Grounding(搜索增强)和 URL Context(URL 上下文)等。

如何使用

  • 预览模型 ID: 开发者可以使用 gemini-2.5-flash-preview-09-2025 模型字符串进行测试。
  • 最新版本别名: Google 推出了 -latest 别名 (gemini-flash-latest),该别名始终指向该系列最新的模型版本,方便开发者持续进行试验。

    DataLearner 官方微信

    欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

    DataLearner 官方微信二维码