排名	模型	MMLU Pro	GPQA Diamond	SWE-bench Verified	MATH-500	AIME 2024	LiveCodeBench	参数(亿)	开源情况
1	Qwen3.5-397B-A17B	87.80	88.40	76.40	0.00	0.00	83.60	397B	免费商用
2	Qwen3.5-27B	86.10	85.50	72.40	0.00	0.00	80.70	270B	免费商用
3	Gemma 4 31B	85.20	84.30	0.00	0.00	0.00	80.00	310B	免费商用
4	Qwen3-235B-A22B-Thinking	84.40	81.10	0.00	0.00	0.00	74.10	305B	免费商用
5	Qwen3-30B-A3B-2507	78.40	70.40	22.00	0.00	0.00	43.20	305B	免费商用
6	QwQ-32B	76.00	58.00	0.00	91.00	79.50	0.00	325B	免费商用
7	GPT OSS 20B	74.00	71.50	34.00	0.00	96.00	0.00	210B	免费商用
8	QwQ-32B-Preview	70.97	0.00	0.00	90.60	50.00	0.00	320B	免费商用
9	Qwen2.5-32B	69.23	0.00	0.00	0.00	0.00	51.20	320B	免费商用
10	Qwen3-30B-A3B	69.10	54.80	0.00	0.00	0.00	29.00	305B	免费商用
11	Mistral-Small-3.2	69.06	46.13	0.00	0.00	0.00	0.00	240B	免费商用
12	Gemma 3 - 27B (IT)	67.50	42.40	0.00	0.00	25.30	29.70	270B	免费商用
13	Mistral-Small-3.1-24B-Instruct-2503	66.76	45.96	0.00	0.00	0.00	0.00	240B	免费商用
14	Gemma2-27B	56.54	0.00	0.00	0.00	0.00	0.00	270B	免费商用
15	C4AI Aya Vision 32B	47.16	33.84	0.00	0.00	0.00	0.00	320B	不可商用
16	GLM-4.7-Flash	0.00	75.20	59.20	0.00	0.00	0.00	310B	免费商用
17	Qwen3-32B	0.00	68.40	0.00	97.20	81.40	65.70	320B	免费商用
18	Magistral-Small-2506	0.00	68.18	0.00	0.00	70.68	55.84	240B	免费商用
19	Devstral Small 1.1	0.00	0.00	53.60	0.00	0.00	0.00	240B	免费商用
20	Qwen3-Coder-Flash	0.00	0.00	51.60	0.00	0.00	0.00	305B	免费商用
21	Devstral Small 1.0	0.00	0.00	46.80	0.00	0.00	0.00	240B	免费商用
22	Codestral	0.00	0.00	0.00	0.00	0.00	31.50	220B	不可商用

综合排名

单项评测排名