Gemini 3.5 FlashvsOpus 4.7

Gemini 3.5 Flash 与 Opus 4.7 在 8 个共同 benchmark 中整体接近：Gemini 3.5 Flash 领先 4 项，Opus 4.7 领先 4 项，持平 0 项，平均分差 -0.36。

Google Deep Mind · 2026-06-20 · 多模态大模型

Anthropic · 2026-04-16 · 推理大模型

Gemini 3.5 Flash4 项(50%)(50%)4 项Opus 4.7

评测分数

按能力类目分组，每组内按分差大小排列；共 8 项。

Gemini 3.5 Flash 领先 3/3

评测项	Gemini 3.5 Flash	Opus 4.7	分差
TerminalBench 2.1	76.208 / 16Thinking High (With Tools)	69.7011 / 16Thinking High (With Tools)	+6.50
MCP-Atlas	83.601 / 23Thinking High (With Tools)	79.105 / 23Deep Thinking (With Tools)	+4.50
OSWorld-Verified	78.406 / 19Thinking High (With Tools)	787 / 19Extended (with tools)	+0.40

Opus 4.7 领先 3/3

评测项	Gemini 3.5 Flash	Opus 4.7	分差
HLE	40.2055 / 161Thinking High (With Tools)	54.709 / 161Extended (with tools)	-14.50
ARC-AGI-2	72.1011 / 59Thinking High (With Tools)	75.809 / 59最高（无工具）	-3.70
LiveBench	75.0217 / 115Thinking High (No Tools)	76.917 / 115Deep Thinking (No Tools)	-1.89

Opus 4.7 领先 1/1

评测项	Gemini 3.5 Flash	Opus 4.7	分差
SWE-Bench Pro - Public	55.1021 / 44Thinking High (With Tools)	64.304 / 44Extended (with tools)	-9.20

Gemini 3.5 Flash 领先 1/1

评测项	Gemini 3.5 Flash	Opus 4.7	分差
Simple Bench	76.704 / 63Normal (No Tools)	61.7013 / 63Normal (No Tools)	+15

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

8 个共同 benchmark 上，Opus 4.7 平均高出 0.36 分。

单项差距最大的 benchmark：Simple Bench — Gemini 3.5 Flash 76.70，Opus 4.7 61.70（分差 +15）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。