GE

Gemini 3.1 Flash-Lite

多模态大模型Gemini 3.1

Gemini 3.1 Flash-Lite

发布时间: 2026-05-07知识截止: 2025-010
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1M
中文支持
支持
推理能力

Google DeepMind 于 2026 年 5 月 7 日 GA 的 Gemini 3.1 Flash-Lite,面向高吞吐、低延迟和成本敏感场景,支持 1M 输入、约 64K 输出以及最高 High 档 thinking。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 3.1 Flash-Lite

模型基本信息

推理过程
支持
思考模式
常规模式 (默认)思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 高 (High)
上下文长度
1M tokens
最大输出长度
64K tokens
模型类型
多模态大模型
输入/输出模态
文本、图像、音频、视频 → 文本
发布时间
2026-05-07
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
2025-01
Gemini 3.1 Flash-Lite

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
Gemini 3.1 Flash-Lite

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Gemini 3.1 Flash-Lite

API接口信息

接口速度
5/5
暂无公开的 API 定价信息。
Gemini 3.1 Flash-Lite

评测结果

Gemini 3.1 Flash-Lite 当前已收录的代表性评测结果包括 MCP-Atlas(19 / 23,得分 57.10)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
MCP-Atlas
工具
57.10
19 / 23

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Gemini 3.1 Flash-Lite

发布机构

Gemini 3.1 Flash-Lite

模型解读

Gemini 3.1 Flash-Lite 是 Google DeepMind 在 Gemini 3.1 系列中面向高吞吐、低延迟和成本敏感场景的 Flash-Lite 模型。Google Cloud 文档显示,正式模型 ID 为 gemini-3.1-flash-lite,发布阶段为 GA,发布日期为 2026 年 5 月 7 日;旧的 gemini-3.1-flash-lite-preview 将停用,应用应迁移到正式版。


规格与能力

官方文档将 Gemini 3.1 Flash-Lite 定位为最具成本效率的 Gemini 模型,面向高容量 LLM 流量。模型支持文本、图像、音频和视频输入,输出为文本;最大输入长度为 1,048,576 tokens,默认最大输出长度为 65,535 tokens。文档还列出可控 thinking levels,包括 minimal、low、medium 和 high,用于在质量与速度之间调节推理开销。


访问方式

模型可通过 Google Cloud Agent Platform / Vertex AI 使用,也可在 Google AI Studio 生态中作为 Gemini API 模型迁移目标。模型参数规模、训练数据细节和权重未公开,因此本条目按闭源模型收录,参数字段留空。


评测收录

Scale Labs 的 MCP-Atlas leaderboard 收录了 gemini-3.1-flash-lite (high),其 All 1000 pass rate 为 57.1%,本次按 DataLearner 的 thinking_high_with_tool mode 写入 MCP-Atlas 成绩。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码