GPQA Diamond 大模型得分排行榜
数据来源:DataLearnerAI
GPQA Diamond详细排名数据表格
排名
模型
得分
发布时间
参数(亿)
#2
#6

Gemini-2.5-Pro
thinking
#15

OpenAI o4 - mini
thinking
#16

Qwen3-235B-A22B-Thinking-2507
thinking
#17

Qwen3-235B-A22B-Thinking
thinking
#18

DeepSeek-R1-0528
thinking
#19

Claude Opus 4.1
thinking + 使用工具
#21

GPT OSS 120B
thinking
#22

DeepSeek-V3.1
thinking
#24
#26
#31

ERNIE-4.5-VL-424B-A47B-Base
thinking
#32
#34

GLM-4.5-Air
thinking
#35
#37
#39
#40

GPT OSS 20B
thinking
#43
#44

Qwen3-235B-A22B
thinking
#46

OpenAI o3-mini
thinking
#49
#51
#52
#54
#60

Qwen3-4B-Thinking-2507
thinking
#63
#64
#68
#69
#70
#72
#74
#77
#78
#82
#83
#90
#92
#93
#96
#100
#101
#102
#103
#105
#106
#107