DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Gemini 2.5 Flash-Lite-Preview-09-2025
GE

Gemini 2.5 Flash-Lite-Preview-09-2025

Gemini 2.5 Flash-Lite-Preview-09-2025

发布时间: 2025-09-25更新于: 2025-09-26 07:35:34373
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1000K
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 2.5 Flash-Lite-Preview-09-2025

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
1000K tokens
最大输出长度
65536 tokens
模型类型
聊天大模型
发布时间
2025-09-25
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
Gemini 2.5 Flash-Lite-Preview-09-2025

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://aistudio.google.com/
Gemini 2.5 Flash-Lite-Preview-09-2025

官方介绍与博客

官方论文
Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release
DataLearnerAI博客
暂无介绍博客
Gemini 2.5 Flash-Lite-Preview-09-2025

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.1$0.4
图片$0.1--
Gemini 2.5 Flash-Lite-Preview-09-2025

评测结果

思考模式

多模态理解

共 2 项评测
评测名称 / 模式
得分
排名/总数
DocVQA
常规
92
4 / 5
MMMU
常规
72.70
15 / 20

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveBench
常规
58.46
47 / 52
查看评测深度分析与其他模型对比
Gemini 2.5 Flash-Lite-Preview-09-2025

发布机构

Google Deep Mind
Google Deep Mind
查看发布机构详情
Gemini 2.5 Flash-Lite-Preview-09-2025

模型解读

Gemini 2.5 Flash-Lite-Preview-09-2025 是 Gemini 模型家族中专注于超低延迟、高并发和最高性价比的一个子模型。它是为那些对延迟和成本有极其严格要求的任务而设计。

定位与特点

Flash-Lite 版本是在保持 Gemini 2.5 Flash 核心能力的基础上,通过进一步的优化来追求极致的效率,其核心定位是:

  1. 超低延迟: 它针对需要快速响应的应用场景进行了优化,能提供 Gemini 模型家族中最快的响应速度。
  2. 最高效率/性价比: 在成本控制方面表现出色,使其成为大规模、高并发部署的首选。
  3. 核心智能保持: 尽管追求效率,但它依然保持了进行推理、编码、函数调用和搜索增强等核心任务的能力。

主要改进亮点(针对 09-2025 预览版)

与 Gemini 2.5 Flash 09-2025 的更新类似,Flash-Lite 预览版也在效率方面进行了加强:

  • 更高的 Token 效率: 模型在开启“思考(Thinking)”功能时,能以更少的 Token 完成任务,进一步降低延迟和运行成本。
  • 持续的 Agentic 能力支持: 尽管它是“Lite”版本,但仍然支持工具调用(Tool Use)和 Agentic 工作流,使其适用于需要快速集成外部功能的轻量级智能体应用。

应用场景

Gemini 2.5 Flash-Lite 适用于以下需要“速度优先”的场景:

类别典型应用
实时交互快速响应的聊天机器人、客户服务系统中的即时回复。
大规模数据处理需要在极短时间内对海量数据进行分类、过滤或标签化的任务。
高并发 API 调用网站或应用后端对模型的 API 调用频率极高,对每秒事务数(TPS)要求严格。
轻量级智能体需要快速使用 Function Calling(函数调用)来执行简单但关键操作的 Agentic 任务。

如何使用

  • 预览模型 ID: 开发者可以使用 gemini-2.5-flash-lite-preview-09-2025 模型字符串在 Google AI Studio 和 Vertex AI 上进行测试。
  • 最新版本别名: Google 也为它推出了 -latest 别名 (gemini-flash-lite-latest),始终指向该系列最新的优化版本,方便开发者持续进行试验。

简而言之,Gemini 2.5 Flash-Lite 是为追求极致速度和最低成本的开发者提供的版本,它在效率上做到了最优,同时保持了执行核心智能任务的能力。

    DataLearner 官方微信

    欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

    DataLearner 官方微信二维码