DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页AI 大模型Gemini 3.0 Flash vs Gemini 2.5 Flash

Gemini 3.0 FlashvsGemini 2.5 Flash

在 7 个共同 benchmark 中,Gemini 3.0 Flash 整体领先:Gemini 3.0 Flash 领先 6 项,Gemini 2.5 Flash 领先 0 项,持平 1 项,平均分差 +23.06。

Google Deep Mind
Gemini 3.0 Flash

Google Deep Mind · 2025-12-17 · 聊天大模型

Google Deep Mind
Gemini 2.5 Flash

Google Deep Mind · 2025-04-17 · 推理大模型

Gemini 3.0 Flash6 项(86%)持平1(0%)0 项Gemini 2.5 Flash

评测分数

按能力类目分组,每组内按分差大小排列;共 7 项。

数学推理

Gemini 3.0 Flash 领先 1/2
评测项Gemini 3.0 FlashGemini 2.5 Flash分差
AIME202599.708 / 106thinking + 使用工具61.6081 / 106+38.10
FrontierMath - Tier 44.2040 / 80Normal (No Tools)4.2040 / 80Normal (No Tools)持平

综合评估

Gemini 3.0 Flash 领先 2/2
评测项Gemini 3.0 FlashGemini 2.5 Flash分差
HLE43.5033 / 150thinking + 使用工具8.40131 / 150+35.10
GPQA Diamond90.4015 / 175thinking78.3079 / 175+12.10

OpenClaw智能体能力综合测评

Gemini 3.0 Flash 领先 1/1
评测项Gemini 3.0 FlashGemini 2.5 Flash分差
Pinch Bench85.2016 / 37Thinking (With Tools)70.7031 / 37Thinking (With Tools)+14.50

常识问答

Gemini 3.0 Flash 领先 1/1
评测项Gemini 3.0 FlashGemini 2.5 Flash分差
SimpleQA68.707 / 45thinking25.8028 / 45+42.90

编程与软件工程

Gemini 3.0 Flash 领先 1/1
评测项Gemini 3.0 FlashGemini 2.5 Flash分差
SWE-bench Verified68.7057 / 103thinking5085 / 103+18.70

规格对比

字段Gemini 3.0 FlashGemini 2.5 Flash
发布机构Google Deep MindGoogle Deep Mind
发布时间2025-12-172025-04-17
模型类型聊天大模型推理大模型
架构稠密模型稠密模型
参数规模0.0暂无数据
上下文长度2000K1000K
最大输出6553665536

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项Gemini 3.0 FlashGemini 2.5 Flash
文本输入0.5 美元/100万 tokens0.15 美元/ 100万 tokens
文本输出3 美元/100万 tokens0.6 美元/ 100万 tokens
缓存读取0.05 美元/100万 tokens暂无公开价格

小结

  • Gemini 3.0 Flash在以下类目领先:数学推理 (1/2)、综合评估 (2/2)、OpenClaw智能体能力综合测评 (1/1)、常识问答 (1/1)、编程与软件工程 (1/1)

7 个共同 benchmark 上,Gemini 3.0 Flash 平均高出 23.06 分。

单项差距最大的 benchmark:SimpleQA — Gemini 3.0 Flash 68.70,Gemini 2.5 Flash 25.80(分差 +42.90)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。

Gemini 3.0 Flash 详情Gemini 2.5 Flash 详情·在工具里自定义对比