Gemini 2.5 Flash-Preview-09-2025
Gemini 2.5 Flash-Preview-09-2025
模型参数
未披露
上下文长度
1000K
中文支持
支持
推理能力
模型基本信息
推理过程
支持
上下文长度
1000K tokens
最大输出长度
65536 tokens
模型类型
暂无数据
发布时间
2025-09-25
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
开源和体验地址
代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
官方介绍与博客
官方论文
DataLearnerAI博客
暂无介绍博客
API接口信息
接口速度
3/5
默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.3 | $2.5 |
| 图片 | $0.3 | -- |
评测得分
发布机构
Google Deep Mind
查看发布机构详情 模型解读
Gemini 2.5 Flash 09-2025 是 Google 推出的 Gemini 2.5 Flash 模型的最新公开预览版本,它专注于在保持高效低成本的同时,显著提升模型的智能和应用能力。
核心改进亮点
此版本模型主要在以下两个关键领域实现了显著提升:
1. 强大的 Agentic 工具使用能力
模型的智能体(Agentic)能力和工具调用(Tool Use)性能得到加强,使其在更复杂、多步骤的应用场景中表现更出色:
- 基准性能飞跃: 在关键的 Agentic 基准测试中,模型性能有明显提升,尤其在 SWE-Bench Verified 测试中,相比上一版本实现了 5% 的增益。
- 长程任务提升: 早期测试者反馈,在内部的长跨度 Agentic 任务中,模型性能实现了 15% 的显著飞跃。
2. 更高的效率和更低的成本
Gemini 2.5 Flash 09-2025 版本在开启“思考(Thinking)”功能时,实现了更高的成本效益:
- Token 效率提升: 模型现在能以更少的 Token 获得更高质量的输出,从而降低延迟和成本。具体来说,相比于之前的版本,输出 Token 减少了 24%。
- 成本效益最佳: 新版本进一步巩固了 Gemini 2.5 Flash 作为“性价比之王”的地位。
其他重要特性与应用场景
Gemini 2.5 Flash 系列作为一款功能全面的“主力模型(workhorse model)”,具备以下特性:
- 内置思考能力: 具有推理能力的模型,能够在生成回复前进行“思考”和推理,从而提高性能和准确性。开发者可以通过 API 参数动态控制“思考预算”,根据需求权衡成本、速度与智能水平。
- 多模态能力增强: 能够更好地理解、解释、组织或总结上传的精细图像或图表内容。
- 输出格式优化: 模型的回复组织和格式得到改进,能更好地使用标题、列表和表格等元素,使复杂的输出更清晰、易于阅读。
- 推荐用途: 适用于大规模处理、低延迟、高并发量的任务,尤其是需要推理和 Agentic 能力的用例。它特别擅长高级推理、编码、数学和科学任务。
- 工具支持: 支持全套原生工具,包括 Function Calling(函数调用)、Code Execution(代码执行)、Google Search Grounding(搜索增强)和 URL Context(URL 上下文)等。
如何使用
- 预览模型 ID: 开发者可以使用
gemini-2.5-flash-preview-09-2025模型字符串进行测试。 - 最新版本别名: Google 推出了
-latest别名 (gemini-flash-latest),该别名始终指向该系列最新的模型版本,方便开发者持续进行试验。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
