排名	模型			开源情况
	GPT-5.4 开启思考工具 OpenAI	92.70	90.50	闭源	详情
	Qwen3.5-27B 开启思考工具阿里巴巴	75.20	90.00	免费商用	详情
	Qwen3.5-397B-A17B 开启思考工具阿里巴巴	—	89.10	免费商用	详情
4	Claude Sonnet 4.5 开启思考工具 Anthropic	88.10	88.20	闭源	详情
5	Claude Sonnet 4.6 开启思考工具 Anthropic	—	88.00	闭源	详情
6	MiniMax M2.5 开启思考工具 MiniMaxAI	92.10	87.80	免费商用	详情
7	Claude Opus 4.6 开启思考工具 Anthropic	—	87.40	闭源	详情
8	Opus 4.5 扩展思考工具 Anthropic	91.50	87.20	闭源	详情
9	MiniMax-M2.7 开启思考工具 MiniMaxAI	91.70	87.10	不可商用	详情
10	Gemini 3.1 Pro Preview 开启思考工具 Google Deep Mind	—	86.70	闭源	详情
11	GLM-5-Turbo 开启思考工具智谱AI	93.80	86.50	闭源	详情
12	GLM-5 开启思考工具智谱AI	91.70	86.40	免费商用	详情
13	GLM-4.5-Air 开启思考工具智谱AI	—	85.70	免费商用	详情
14	Qwen3.5-122B-A10B 开启思考工具阿里巴巴	86.00	85.50	免费商用	详情
15	Step 3.5 Flash 开启思考工具 StepFunAI	84.90	85.30	免费商用	详情
16	Gemini 3.0 Flash 开启思考工具 Google Deep Mind	85.70	85.20	闭源	详情
17	Kimi K2.5 开启思考工具 Moonshot AI	81.70	84.80	免费商用	详情
18	DeepSeek V3.2 开启思考工具 DeepSeek-AI	79.00	84.30	免费商用	详情
19	M2.1 开启思考工具 MiniMaxAI	—	84.30	免费商用	详情
20	Grok 4.1 Fast 开启思考工具 xAI	88.60	82.40	闭源	详情
21	Haiku 4.5 开启思考工具 Anthropic	89.40	82.00	闭源	详情
22	Claude Sonnet 4 开启思考工具 Anthropic	77.80	80.50	闭源	详情
23	GPT-5-mini 开启思考工具 OpenAI	—	80.30	闭源	详情
24	Qwen3-Max-Thinking 开启思考工具阿里巴巴	—	80.30	闭源	详情
25	Qwen3-Coder-Next 开启思考工具阿里巴巴	75.80	79.10	免费商用	详情
26	Qwen3.5-35B-A3B 开启思考工具阿里巴巴	91.40	78.40	免费商用	详情
27	GPT-4o mini 开启思考工具 OpenAI	—	75.00	闭源	详情
28	Mistral Large 3 开启思考工具 MistralAI	78.60	72.20	免费商用	详情
29	Gemini 2.5 Pro Experimental 03-25 开启思考工具 Google Deep Mind	80.40	71.90	闭源	详情
30	GPT-4o 开启思考工具 OpenAI	—	71.10	闭源	详情
31	Gemini 3.0 Pro (Preview 11-2025) 开启思考工具 Google Deep Mind	—	70.70	闭源	详情
32	Gemini 2.5 Flash 开启思考工具 Google Deep Mind	—	70.70	闭源	详情
33	GPT-5-Nano 开启思考工具 OpenAI	—	68.80	闭源	详情
34	GPT OSS 20B 开启思考工具 OpenAI	—	66.00	免费商用	详情
35	GPT OSS 120B 开启思考工具 OpenAI	—	60.60	免费商用	详情
36	Llama 4 Maverick 开启思考工具 Facebook AI研究实验室	—	46.10	免费商用	详情
37	Qwen2.5-7B 开启思考工具阿里巴巴	—	40.30	免费商用	详情
38	Doubao Seed 2.0 Lite 开启思考字节跳动Seed团队	93.10	—	闭源	详情
39	GLM-5V-Turbo 开启思考工具智谱AI	90.10	—	闭源	详情
40	GPT-5.4 nano 开启思考工具 OpenAI	89.70	—	闭源	详情
41	Kimi K2 Thinking 开启思考工具 Moonshot AI	82.50	—	免费商用	详情
42	Kimi K2.6 开启思考工具 Moonshot AI	80.90	—	免费商用	详情
43	GPT-5.4 mini 开启思考工具 OpenAI	75.30	—	闭源	详情
44	Qwen3.6-27B 开启思考工具阿里巴巴	72.40	—	免费商用	详情
45	Nova 2 Lite 开启思考工具亚马逊	68.50	—	闭源	详情
46	ERNIE 5.0 Thinking Preview 开启思考百度	51.00	—	闭源	详情