排名	模型	MMLU Pro	GPQA Diamond	MATH-500	AIME 2024	LiveCodeBench	参数(亿)	开源情况
1	Pangu Pro MoE	82.60	73.70	96.80	79.20	59.60	719B	免费商用
2	Llama3.3-70B-Instruct	68.90	50.50	0.00	0.00	33.30	700B	免费商用
3	Hunyuan-A13B-Instruct	67.23	71.20	0.00	87.30	63.90	800B	免费商用
4	Llama3.1-70B-Instruct	66.40	48.00	0.00	0.00	33.30	700B	免费商用
5	Qwen3-Next	66.05	0.00	0.00	0.00	56.60	800B	免费商用
6	Qwen2.5-72B	58.10	45.90	0.00	0.00	0.00	727B	免费商用
7	Llama3-70B-Instruct	56.20	0.00	0.00	0.00	0.00	700B	免费商用
8	Llama3-70B	52.78	0.00	0.00	0.00	0.00	700B	免费商用
9	Llama3.1-70B	52.47	0.00	0.00	0.00	0.00	700B	免费商用
10	DeepSeek-R1-Distill-Llama-70B	0.00	65.20	94.50	0.00	0.00	700B	免费商用

综合排名

单项评测排名