Gemini 3.5 Flash
Gemini 3.5 Flash 是由 Google Deep Mind 发布的 AI 模型,发布时间为 2026-06-20,定位为 多模态大模型,上下文长度为 1M,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 文本 | - | $1.50/ 1M | $9.00/ 1M |
Gemini 3.5 Flash 当前已收录的代表性评测结果包括 ARC-AGI-2(11 / 59,得分 72.10)、OSWorld-Verified(3 / 15,得分 78.40)、HLE(45 / 150,得分 40.20)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Gemini 3.5 Flash 是 Google DeepMind 研发的下一代轻量级多模态大模型,目前尚未正式发布[reference:0]。该模型计划于 2026 年 5 月 19 日的 Google I/O 大会上与性能更强的 Gemini 3.5 Pro 一同亮相[reference:1]。此前,有开发者在谷歌的编程环境 Antigravity 中发现了可能是 Gemini 3.5 Flash 的早期版本,其代码生成能力远超市面上现有的 Flash 模型[reference:2]。该模型旨在以极低的成本和延迟,提供接近旗舰模型的能力,为高并发、成本敏感的 AI 应用而设计[reference:3]。
根据泄露信息,Gemini 3.5 Flash 得益于谷歌更激进的模型蒸馏和稀疏化技术,成功将前沿大模型的能力压缩到一个更小、更高效的模型中[reference:4]。其上下文窗口预计为 1,000,000 tokens,与系列其他模型保持一致,能够处理超长文本和多模态任务[reference:5]。最大输出长度约为 66,000 tokens[reference:6]。目前,该模型的参数量、激活参数量及训练数据等具体细节尚未公开。
作为一款多模态大模型,Gemini 3.5 Flash 支持对文本、图像、音频和视频等多种模态的输入与理解[reference:7]。泄露的测试数据显示,其核心能力取得了显著突破:
目前,Gemini 3.5 Flash 尚无官方基准测试成绩。然而,多方泄露的评估信息揭示了其强大的性能潜力:
得益于其低成本、低延迟的特点,Gemini 3.5 Flash 非常适合用于高并发的在线业务、代码助手、轻量级 AI Agent 等场景[reference:14]。泄露信息也指出其局限性,例如在 UI 设计上可能存在“过度设计”的倾向,以及在处理某些特定指令时可能不够一致[reference:15][reference:16]。
Gemini 3.5 Flash 目前尚未正式开放。其定价、API 访问方式、开源协议及商用许可等信息均未公布。市场传闻其 API 定价可能为输入 $0.25/1M tokens,输出 $2.00/1M tokens[reference:17]。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
