Claude Sonnet 4.6vsGemini 3.0 Pro (Preview 11-2025)

Across 13 shared benchmarks, Claude Sonnet 4.6 leads overall: Claude Sonnet 4.6 wins 8, Gemini 3.0 Pro (Preview 11-2025) wins 4, with 1 ties and an average score difference of +4.89.

Claude Sonnet 4.6

Anthropic · 2026-02-17 · Chat model

Gemini 3.0 Pro (Preview 11-2025)

Google Deep Mind · 2025-11-18 · Multimodal model

Claude Sonnet 4.68 wins(62%)Ties1(31%)4 winsGemini 3.0 Pro (Preview 11-2025)

Benchmark scores

Grouped by capability, sorted by largest gap within each. 13 shared benchmarks.

General Knowledge

Claude Sonnet 4.6 3/4

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
ARC-AGI-2	58.3021 / 62	45.1026 / 62	+13.20
GPQA Diamond	89.9024 / 187	93.805 / 187	-3.90
HLE	4932 / 172	45.8040 / 172	+3.20
LiveBench	75.4712 / 115Thinking Medium (No Tools)	73.3924 / 115Thinking High (No Tools)	+2.08

AI Agent - Tool Usage

Even 2/2

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
Terminal Bench 2.0	59.1022 / 47	56.9025 / 47	+2.20
MCP-Atlas	69.5017 / 27Normal (With Tools)	70.3015 / 27Normal (With Tools)	-0.80

Agent Level Benchmark

Gemini 3.0 Pro (Preview 11-2025) 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
τ²-Bench - Telecom	97.909 / 35	985 / 35	-0.10

AI Agent - Information Search

Claude Sonnet 4.6 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
BrowseComp	74.7027 / 53	59.2038 / 53	+15.50

Claw-style Agent Evaluation

Claude Sonnet 4.6 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
Pinch Bench	885 / 37Thinking (With Tools)	70.7031 / 37Thinking (With Tools)	+17.30

Coding and Software Engineer

Claude Sonnet 4.6 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
SWE-bench Verified	79.6018 / 112	76.2036 / 112	+3.40

Long Context

Even 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
AA-LCR	713 / 15	713 / 15	—

Math and Reasoning

Gemini 3.0 Pro (Preview 11-2025) 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
FrontierMath - Tier 4	8.3034 / 80Thinking (No Tools, 16K Budget)	18.8016 / 80	-10.50

Productivity Knowledge

Claude Sonnet 4.6 1/1

Benchmark	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)	Diff
GDPval-AA	5711 / 21	3518 / 21	+22

Specs

Field	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)
Publisher	Anthropic	Google Deep Mind
Release date	2026-02-17	2025-11-18
Model type	Chat model	Multimodal model
Architecture	Dense	Dense
Parameters	Not available	Not available
Context length	1M	1000K
Max output	8K	64K

API pricing

Prices use DataLearner records when available; missing fields are not inferred.

Item	Claude Sonnet 4.6	Gemini 3.0 Pro (Preview 11-2025)
Text input	$3 / 1M tokens	$2 / 1M tokens
Text output	$15 / 1M tokens	$12 / 1M tokens
Cache read	$0.3 / 1M tokens	Not public
Cache write	$3.75 / 1M tokens	Not public

Summary

Claude Sonnet 4.6leads in:General Knowledge (3/4), AI Agent - Information Search (1/1), Claw-style Agent Evaluation (1/1), Coding and Software Engineer (1/1), Productivity Knowledge (1/1)
Gemini 3.0 Pro (Preview 11-2025)leads in:Agent Level Benchmark (1/1), Math and Reasoning (1/1)
Tied in:AI Agent - Tool Usage, Long Context

On average across the 13 shared benchmarks, Claude Sonnet 4.6 scores 4.89 higher.

Largest single-benchmark gap: GDPval-AA — Claude Sonnet 4.6 57 vs Gemini 3.0 Pro (Preview 11-2025) 35 (+22).

Page generated from structured model, pricing and benchmark records. No real-time LLM is used to write the prose.

Claude Sonnet 4.6 details Gemini 3.0 Pro (Preview 11-2025) details·Customize in compare tool