Gemini 3.5 Flash
Gemini 3.5 Flash 是由 Google Deep Mind 发布的 AI 模型,发布时间为 2026-06-20,定位为 多模态大模型,上下文长度为 1M,采用 不开源 许可,在 MCP-Atlas 上取得 83.60 分。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 文本 | - | $1.50/ 1M | $9.00/ 1M |
评测结果
Gemini 3.5 Flash 当前已收录的代表性评测结果包括 MCP-Atlas(1 / 23,得分 83.60)、Simple Bench(4 / 63,得分 76.70)、LiveBench(17 / 115,得分 75.02)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
AI Agent - 工具使用
共 3 项评测和其他模型对比
发布机构
模型解读
模型简介与核心特点
Gemini 3.5 Flash 是 Google DeepMind 研发的下一代轻量级多模态大模型,目前尚未正式发布[reference:0]。该模型计划于 2026 年 5 月 19 日的 Google I/O 大会上与性能更强的 Gemini 3.5 Pro 一同亮相[reference:1]。此前,有开发者在谷歌的编程环境 Antigravity 中发现了可能是 Gemini 3.5 Flash 的早期版本,其代码生成能力远超市面上现有的 Flash 模型[reference:2]。该模型旨在以极低的成本和延迟,提供接近旗舰模型的能力,为高并发、成本敏感的 AI 应用而设计[reference:3]。
架构与技术规格
根据泄露信息,Gemini 3.5 Flash 得益于谷歌更激进的模型蒸馏和稀疏化技术,成功将前沿大模型的能力压缩到一个更小、更高效的模型中[reference:4]。其上下文窗口预计为 1,000,000 tokens,与系列其他模型保持一致,能够处理超长文本和多模态任务[reference:5]。最大输出长度约为 66,000 tokens[reference:6]。目前,该模型的参数量、激活参数量及训练数据等具体细节尚未公开。
核心能力与支持模态
作为一款多模态大模型,Gemini 3.5 Flash 支持对文本、图像、音频和视频等多种模态的输入与理解[reference:7]。泄露的测试数据显示,其核心能力取得了显著突破:
- 代码生成: 在 Antigravity 环境的实战测试中,它能在一分钟内生成 1,900 到 2,000 行具备生产级质量的代码,吞吐量峰值达到每秒 1,300 tokens[reference:8]。
- 视觉与图形生成: 在 SVG 生成、交互式 3D 编码和动画处理方面,其表现已经超越了前代旗舰模型 Gemini 3.1 Pro[reference:9][reference:10]。
- 推理能力: 支持“思考模式”,能够处理复杂的逻辑推理任务[reference:11]。
性能与基准评测
目前,Gemini 3.5 Flash 尚无官方基准测试成绩。然而,多方泄露的评估信息揭示了其强大的性能潜力:
- 综合性能: 性能据称已接近 GPT-5.5 和 Claude Opus 4.7 等旗舰模型[reference:12]。
- 编程能力: 前代版本 Gemini 3.2 Flash 在编码和推理任务上已达到 GPT-5.5 92% 的水平[reference:13]。
应用场景与限制
得益于其低成本、低延迟的特点,Gemini 3.5 Flash 非常适合用于高并发的在线业务、代码助手、轻量级 AI Agent 等场景[reference:14]。泄露信息也指出其局限性,例如在 UI 设计上可能存在“过度设计”的倾向,以及在处理某些特定指令时可能不够一致[reference:15][reference:16]。
访问方式与许可
Gemini 3.5 Flash 目前尚未正式开放。其定价、API 访问方式、开源协议及商用许可等信息均未公布。市场传闻其 API 定价可能为输入 $0.25/1M tokens,输出 $2.00/1M tokens[reference:17]。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
