Gemini 2.5 Flash-Lite-Preview-09-2025

Name: Gemini 2.5 Flash-Lite-Preview-09-2025
Price: 0.05 USD
Availability: InStock
Author: Google Deep Mind

聊天大模型Gemini Flash-LiteGemini 2.5

发布时间: 2025-09-25更新于: 2025-09-26 07:35:34468

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

1000K

中文支持

支持

推理能力

Gemini 2.5 Flash-Lite-Preview-09-2025 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2025-09-25，定位为聊天大模型，上下文长度为 1000K，采用不开源许可，在 DocVQA 上取得 92.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 2.5 Flash-Lite-Preview-09-2025

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

1000K tokens

最大输出长度

64K tokens

模型类型

聊天大模型

输入/输出模态

文本、图像 → 文本

发布时间

2025-09-25

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Gemini 2.5 Flash-Lite-Preview-09-2025

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://aistudio.google.com/

Gemini 2.5 Flash-Lite-Preview-09-2025

官方介绍与博客

官方论文

Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release

DataLearnerAI博客

暂无介绍博客

Gemini 2.5 Flash-Lite-Preview-09-2025

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.100/ 1M	$0.400/ 1M

批量模式

类型	适用条件	输入	输出
文本	-	$0.050/ 1M	$0.200/ 1M

Gemini 2.5 Flash-Lite-Preview-09-2025

评测结果

Gemini 2.5 Flash-Lite-Preview-09-2025 当前已收录的代表性评测结果包括 MMMU（21 / 29，得分 72.70）、DocVQA（4 / 5，得分 92）、LiveBench（108 / 115，得分 42.39）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

多模态理解

共 2 项评测

评测名称 / 模式

得分

排名/总数

DocVQA

4 / 5

MMMU

72.70

21 / 29

综合评估

共 1 项评测

评测名称 / 模式

得分

排名/总数

LiveBench

高

42.39

108 / 115

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Gemini 2.5 Flash-Lite-Preview-09-2025

发布机构

Google Deep Mind

查看发布机构详情

Gemini 2.5 Flash-Lite-Preview-09-2025

模型解读

Gemini 2.5 Flash-Lite-Preview-09-2025 是 Gemini 模型家族中专注于超低延迟、高并发和最高性价比的一个子模型。它是为那些对延迟和成本有极其严格要求的任务而设计。

定位与特点

Flash-Lite 版本是在保持 Gemini 2.5 Flash 核心能力的基础上，通过进一步的优化来追求极致的效率，其核心定位是：

超低延迟： 它针对需要快速响应的应用场景进行了优化，能提供 Gemini 模型家族中最快的响应速度。
最高效率/性价比： 在成本控制方面表现出色，使其成为大规模、高并发部署的首选。
核心智能保持： 尽管追求效率，但它依然保持了进行推理、编码、函数调用和搜索增强等核心任务的能力。

主要改进亮点（针对 09-2025 预览版）

与 Gemini 2.5 Flash 09-2025 的更新类似，Flash-Lite 预览版也在效率方面进行了加强：

更高的 Token 效率： 模型在开启“思考（Thinking）”功能时，能以更少的 Token 完成任务，进一步降低延迟和运行成本。
持续的 Agentic 能力支持： 尽管它是“Lite”版本，但仍然支持工具调用（Tool Use）和 Agentic 工作流，使其适用于需要快速集成外部功能的轻量级智能体应用。

应用场景

Gemini 2.5 Flash-Lite 适用于以下需要“速度优先”的场景：

类别	典型应用
实时交互	快速响应的聊天机器人、客户服务系统中的即时回复。
大规模数据处理	需要在极短时间内对海量数据进行分类、过滤或标签化的任务。
高并发 API 调用	网站或应用后端对模型的 API 调用频率极高，对每秒事务数（TPS）要求严格。
轻量级智能体	需要快速使用 Function Calling（函数调用）来执行简单但关键操作的 Agentic 任务。

如何使用

预览模型 ID： 开发者可以使用 gemini-2.5-flash-lite-preview-09-2025 模型字符串在 Google AI Studio 和 Vertex AI 上进行测试。
最新版本别名： Google 也为它推出了 -latest 别名 (gemini-flash-lite-latest)，始终指向该系列最新的优化版本，方便开发者持续进行试验。

简而言之，Gemini 2.5 Flash-Lite 是为追求极致速度和最低成本的开发者提供的版本，它在效率上做到了最优，同时保持了执行核心智能任务的能力。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送