Gemini 3.5 Flash

Name: Gemini 3.5 Flash
Price: 1.5 USD
Availability: InStock
Author: Google Deep Mind

多模态大模型Gemini FlashGemini 3.5

Gemini 3.5 Flash

发布时间: 2026-06-20更新于: 2026-05-20 10:04:56.279知识截止: 2025-011,338

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

中文支持

支持

推理能力

Gemini 3.5 Flash 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2026-06-20，定位为多模态大模型，上下文长度为 1M，采用不开源许可，在 MCP-Atlas 上取得 83.60 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 3.5 Flash

模型基本信息

推理过程

支持

思考模式

思考水平 · 高 (High) (默认)常规模式思考水平 · 低 (Low)

上下文长度

1M tokens

最大输出长度

64K tokens

模型类型

多模态大模型

输入/输出模态

暂无数据

发布时间

2026-06-20

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

2025-01

Gemini 3.5 Flash

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.google.com/

Gemini 3.5 Flash

官方介绍与博客

官方论文

Gemini 3.5: frontier intelligence with action

DataLearnerAI博客

暂无介绍博客

Gemini 3.5 Flash

API接口信息

接口速度

4/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$1.50/ 1M	$9.00/ 1M

Gemini 3.5 Flash

评测结果

Gemini 3.5 Flash 当前已收录的代表性评测结果包括 MCP-Atlas（1 / 23，得分 83.60）、Simple Bench（4 / 63，得分 76.70）、LiveBench（17 / 115，得分 75.02）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

LiveBench

高

75.02

17 / 115

ARC-AGI-2

高工具

72.10

11 / 59

HLE

高工具

40.20

55 / 161

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

76.70

4 / 63

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

SWE-Bench Pro - Public

高工具

55.10

21 / 44

DeepSWE

中工具

6 / 9

AI Agent - 工具使用

共 3 项评测

评测名称 / 模式

得分

排名/总数

MCP-Atlas

高工具

83.60

1 / 23

OSWorld-Verified

高工具

78.40

6 / 19

TerminalBench 2.1

高工具

76.20

8 / 16

查看评测深度分析与其他模型对比

和其他模型对比

想自定义其他组合？打开对比工具

Gemini 3.5 Flash

发布机构

Google Deep Mind

查看发布机构详情

Gemini 3.5 Flash

模型解读

模型简介与核心特点

Gemini 3.5 Flash 是 Google DeepMind 研发的下一代轻量级多模态大模型，目前尚未正式发布[reference:0]。该模型计划于 2026 年 5 月 19 日的 Google I/O 大会上与性能更强的 Gemini 3.5 Pro 一同亮相[reference:1]。此前，有开发者在谷歌的编程环境 Antigravity 中发现了可能是 Gemini 3.5 Flash 的早期版本，其代码生成能力远超市面上现有的 Flash 模型[reference:2]。该模型旨在以极低的成本和延迟，提供接近旗舰模型的能力，为高并发、成本敏感的 AI 应用而设计[reference:3]。

架构与技术规格

根据泄露信息，Gemini 3.5 Flash 得益于谷歌更激进的模型蒸馏和稀疏化技术，成功将前沿大模型的能力压缩到一个更小、更高效的模型中[reference:4]。其上下文窗口预计为 1,000,000 tokens，与系列其他模型保持一致，能够处理超长文本和多模态任务[reference:5]。最大输出长度约为 66,000 tokens[reference:6]。目前，该模型的参数量、激活参数量及训练数据等具体细节尚未公开。

核心能力与支持模态

作为一款多模态大模型，Gemini 3.5 Flash 支持对文本、图像、音频和视频等多种模态的输入与理解[reference:7]。泄露的测试数据显示，其核心能力取得了显著突破：

代码生成： 在 Antigravity 环境的实战测试中，它能在一分钟内生成 1,900 到 2,000 行具备生产级质量的代码，吞吐量峰值达到每秒 1,300 tokens[reference:8]。
视觉与图形生成： 在 SVG 生成、交互式 3D 编码和动画处理方面，其表现已经超越了前代旗舰模型 Gemini 3.1 Pro[reference:9][reference:10]。
推理能力： 支持“思考模式”，能够处理复杂的逻辑推理任务[reference:11]。

性能与基准评测

目前，Gemini 3.5 Flash 尚无官方基准测试成绩。然而，多方泄露的评估信息揭示了其强大的性能潜力：

综合性能： 性能据称已接近 GPT-5.5 和 Claude Opus 4.7 等旗舰模型[reference:12]。
编程能力： 前代版本 Gemini 3.2 Flash 在编码和推理任务上已达到 GPT-5.5 92% 的水平[reference:13]。

应用场景与限制

得益于其低成本、低延迟的特点，Gemini 3.5 Flash 非常适合用于高并发的在线业务、代码助手、轻量级 AI Agent 等场景[reference:14]。泄露信息也指出其局限性，例如在 UI 设计上可能存在“过度设计”的倾向，以及在处理某些特定指令时可能不够一致[reference:15][reference:16]。

访问方式与许可

Gemini 3.5 Flash 目前尚未正式开放。其定价、API 访问方式、开源协议及商用许可等信息均未公布。市场传闻其 API 定价可能为输入 $0.25/1M tokens，输出 $2.00/1M tokens[reference:17]。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送