GPT-5.5 vs Gemini 3.1 Pro Preview: benchmarks, pricing and specs

GPT-5.5 vs Gemini 3.1 Pro Preview: benchmarks, pricing and specs | DataLearnerAI

Benchmark scores

Grouped by capability, sorted by largest gap within each. 10 shared benchmarks.

GPT-5.5 2/4

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
ARC-AGI-2	851 / 58极高强度思考（无工具）	77.107 / 58Thinking High (No Tools)	+7.90
HLE	52.2010 / 149Thinking High (With Tools)	51.4012 / 149Thinking High (With Tools)	+0.80
GPQA Diamond	93.606 / 175Thinking High (No Tools)	94.303 / 175Thinking High (No Tools)	-0.70
ARC-AGI-3	02 / 6Thinking High (No Tools)	03 / 6Thinking High (No Tools)	—

GPT-5.5 2/2

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
FrontierMath - Tier 4	35.407 / 80Thinking High (With Tools)	16.7020 / 80Normal (No Tools)	+18.70
FrontierMath	51.702 / 60Thinking High (With Tools)	36.9011 / 60Thinking High (No Tools)	+14.80

Gemini 3.1 Pro Preview 1/1

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
τ²-Bench - Telecom	985 / 35Thinking High (With Tools)	99.301 / 35Thinking High (With Tools)	-1.30

Gemini 3.1 Pro Preview 1/1

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
BrowseComp	84.405 / 43Thinking High (With Tools + Internet)	85.903 / 43Thinking High (With Tools + Internet)	-1.50

GPT-5.5 1/1

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
Terminal Bench 2.0	82.701 / 43Thinking High (With Tools)	68.506 / 43Thinking High (With Tools)	+14.20

GPT-5.5 1/1

Benchmark	GPT-5.5	Gemini 3.1 Pro Preview	Diff
SWE-Bench Pro - Public	58.603 / 36Thinking High (With Tools)	54.2017 / 36Thinking High (With Tools)	+4.40

Prices use DataLearner records when available; missing fields are not inferred.