Opus 4.7 vs GPT-5.4: benchmarks, pricing and specs

Opus 4.7 vs GPT-5.4: benchmarks, pricing and specs | DataLearnerAI

Benchmark scores

Grouped by capability, sorted by largest gap within each. 11 shared benchmarks.

Even 5/5

Benchmark	Opus 4.7	GPT-5.4	Diff
HLE	54.706 / 149Extended (with tools)	52.1011 / 149极高强度思考（工具）	+2.60
GPQA Diamond	94.204 / 175Extended (no tools)	92.809 / 175极高强度思考（无工具）	+1.40
ARC-AGI-2	75.809 / 58最高（无工具）	77.107 / 58Normal (No Tools)	-1.30
ARC-AGI	93.509 / 65Thinking High (No Tools)	93.707 / 65Normal (No Tools)	-0.20
ARC-AGI-3	05 / 6Thinking High (No Tools)	04 / 6Thinking High (No Tools)	—

Even 2/2

Benchmark	Opus 4.7	GPT-5.4	Diff
Terminal Bench 2.0	69.405 / 43Extended (with tools)	75.104 / 43极高强度思考（工具）	-5.70
OSWorld-Verified	783 / 14Extended (with tools)	754 / 14极高强度思考（工具）	+3

GPT-5.4 2/2

Benchmark	Opus 4.7	GPT-5.4	Diff
FrontierMath - Tier 4	22.9012 / 80极高强度思考（无工具）	27.1011 / 80极高强度思考（无工具）	-4.20
FrontierMath	43.806 / 60极高强度思考（无工具）	47.605 / 60极高强度思考（无工具）	-3.80

GPT-5.4 1/1

Benchmark	Opus 4.7	GPT-5.4	Diff
BrowseComp	79.3011 / 43Extended (with tools)	82.709 / 43极高强度思考（工具）	-3.40

Opus 4.7 1/1

Benchmark	Opus 4.7	GPT-5.4	Diff
SWE-Bench Pro - Public	64.302 / 36Extended (with tools)	57.706 / 36极高强度思考（无工具）	+6.60

Prices use DataLearner records when available; missing fields are not inferred.