加载中...
加载中...
Gemini 2.5 Flash-Lite-Preview-09-2025
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.1 | $0.4 |
| 图片 | $0.1 | -- |
Gemini 2.5 Flash-Lite-Preview-09-2025 是 Gemini 模型家族中专注于超低延迟、高并发和最高性价比的一个子模型。它是为那些对延迟和成本有极其严格要求的任务而设计。
Flash-Lite 版本是在保持 Gemini 2.5 Flash 核心能力的基础上,通过进一步的优化来追求极致的效率,其核心定位是:
与 Gemini 2.5 Flash 09-2025 的更新类似,Flash-Lite 预览版也在效率方面进行了加强:
Gemini 2.5 Flash-Lite 适用于以下需要“速度优先”的场景:
| 类别 | 典型应用 |
|---|---|
| 实时交互 | 快速响应的聊天机器人、客户服务系统中的即时回复。 |
| 大规模数据处理 | 需要在极短时间内对海量数据进行分类、过滤或标签化的任务。 |
| 高并发 API 调用 | 网站或应用后端对模型的 API 调用频率极高,对每秒事务数(TPS)要求严格。 |
| 轻量级智能体 | 需要快速使用 Function Calling(函数调用)来执行简单但关键操作的 Agentic 任务。 |
gemini-2.5-flash-lite-preview-09-2025 模型字符串在 Google AI Studio 和 Vertex AI 上进行测试。-latest 别名 (gemini-flash-lite-latest),始终指向该系列最新的优化版本,方便开发者持续进行试验。简而言之,Gemini 2.5 Flash-Lite 是为追求极致速度和最低成本的开发者提供的版本,它在效率上做到了最优,同时保持了执行核心智能任务的能力。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
