评测结果
Gemini 3.0 Flash
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 3 项评测评测名称 / 模式
得分
排名/总数
竞品对比
Gemini 3.0 Flash 与同类主流模型的评测得分对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;具体模式明细请看下方表格。
9 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。
| 评测项 | Gemini 3.0 Flash当前 | Claude Sonnet 4 |
|---|---|---|
ARC-AGI-2 综合评估 | 33.60开启思考 | 5.90开启思考 |
GPQA Diamond 综合评估 | 90.40开启思考 | 83.80深度思考模式 | 工具 |
HLE 综合评估 | 43.50开启思考 | 工具 | 9.60开启思考 |
SWE-Bench Pro - Public 编程与软件工程 | 49.60思考水平·高 | 工具 | 42.70开启思考 |
SWE-bench Verified 编程与软件工程 | 68.70开启思考 | 80.20开启思考 | 工具 |
AIME2025 数学推理 | 99.70开启思考 | 工具 | 85.00深度思考模式 | 工具 |
τ²-Bench Agent能力评测 | 90.20开启思考 | 工具 | 52.00常规模式 | 工具 |
Claw Bench OpenClaw智能体能力综合测评 | 85.70开启思考 | 工具 | 77.80开启思考 | 工具 |
Pinch Bench OpenClaw智能体能力综合测评 | 85.20开启思考 | 工具 | 80.50开启思考 | 工具 |
Gemini 3.0 Flash 与同类模型的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。
这些模型的价格币种或计费单位不一致,暂不直接绘制统一柱状图,以下展示原始价格。
Gemini 3.0 Flash
标准输入: 0.5 美元/100万 tokens
标准输出: 3 美元/100万 tokens
Claude Sonnet 4
标准输入: 3 美元/ 100万tokens
标准输出: 15 美元/100万tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Gemini 3.0 Flash | — | 0.5 美元/100万 tokens | 3 美元/100万 tokens | — |
Claude Sonnet 4 | — | 3 美元/ 100万tokens | 15 美元/100万tokens | — |
历代版本对比
Gemini 3.0 Flash 系列各版本的评测成绩纵向对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;具体模式明细请看下方表格。
7 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。· 点击任意行可切换下方趋势图。
| 评测项 | Gemini 3.0 Flash当前 | Gemini 2.5 Flash | Gemini 2.0 Flash Experimental |
|---|---|---|---|
GPQA Diamond 综合评估 | 90.40开启思考 | 82.80开启思考 | 65.20常规模式 |
HLE 综合评估 | 43.50开启思考 | 工具 | 11.00开启思考 | 5.10常规模式 |
SimpleQA 常识问答 | 68.70开启思考 | 26.90开启思考 | 29.90常规模式 |
SWE-bench Verified 编程与软件工程 | 68.70开启思考 | 50.00常规模式 | 21.40常规模式 |
AIME2025 数学推理 | 99.70开启思考 | 工具 | 72.00开启思考 | 29.70常规模式 |
4.20常规模式 | 4.20常规模式 | -- | |
Pinch Bench OpenClaw智能体能力综合测评 | 85.20开启思考 | 工具 | 70.70开启思考 | 工具 | -- |
单评测历史趋势图
当前查看:GPQA Diamond · 综合评估
选择评测
Gemini 3.0 Flash 所在系列的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。
这些模型的价格币种或计费单位不一致,暂不直接绘制统一柱状图,以下展示原始价格。
Gemini 3.0 Flash
标准输入: 0.5 美元/100万 tokens
标准输出: 3 美元/100万 tokens
Gemini 2.5 Flash
标准输入: 0.15 美元/ 100万 tokens
标准输出: 0.6 美元/ 100万 tokens
Gemini 2.0 Flash Experimental
标准输入: 0.10 美元/ 100万 tokens
标准输出: 0.40 美元/ 100万 tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Gemini 3.0 Flash | — | 0.5 美元/100万 tokens | 3 美元/100万 tokens | — |
Gemini 2.5 Flash | — | 0.15 美元/ 100万 tokens | 0.6 美元/ 100万 tokens | — |
Gemini 2.0 Flash Experimental | — | 0.10 美元/ 100万 tokens | 0.40 美元/ 100万 tokens | — |