排名	模型	MMLU Pro	GPQA Diamond	MATH-500	AIME 2024	参数(亿)	开源情况
1	Phi-4-mini-instruct (3.8B)	52.80	36.00	71.80	10.00	38B	免费商用
2	Qwen2.5-3B	34.60	24.30	0.00	0.00	30B	免费商用
3	Llama-3.2-3B	25.00	26.60	0.00	0.00	32B	免费商用
4	Phi-4-instruct (reasoning-trained)	0.00	49.00	90.40	50.00	38B	不开源

综合排名

单项评测排名