LMArena 评测赛道

Text Generation Arena 文本生成模型排行榜

Name: Text Generation Arena 文本生成模型排行榜
Creator: DataLearner
License: https://creativecommons.org/licenses/by/4.0/

基于 Text Generation Arena 用户匿名投票的最新AI文本生成模型排行榜，涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

Claude Fable 5

最高得分

1,509

模型数量

374

数据版本

2026年07月10日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前最强 AI 大模型在文本生成任务中的综合实力排名。数据来源于 LMArena（前身为 LMSYS Chatbot Arena），这是目前全球最大的 AI 模型众包评测平台。用户在平台上与两个匿名模型同时对话，并投票选出更好的回答——排名完全由真实用户的偏好决定，而非实验室基准测试。

评测方法概要

匿名盲测：用户同时与两个"隐藏身份"的模型对话，根据回答质量投票，排除品牌偏见。

Elo 评分：基于国际象棋领域的 Elo Rating 体系（Bradley-Terry 模型），通过对战结果计算每个模型的实力分数。分数越高，说明模型在真实对话中被用户选中的概率越大。

场景覆盖广泛：涵盖编程、创意写作、数学推理、知识问答、角色扮演等高频真实场景。

DataLearner 在原始数据基础上提供中文解读与深度分析，并将排行榜模型关联至 DataLearner 模型库，方便您一键查看模型详情、API 定价、评测得分等完整信息。

来源：全部国产模型

榜单历史快照月份:

排名总表

排名	模型名称	得分	95% CI	投票数	机构	许可证
	Claude Fable 5Anthropic	1,509	+/-9	4,299	Anthropic	Proprietary
	Claude Opus 4.6 (thinking)Anthropic	1,504	+/-4	58,968	Anthropic	Proprietary
	Opus 4.7 (thinking)Anthropic	1,503	+/-4	46,183	Anthropic	Proprietary
4	Claude Opus 4.6Anthropic	1,498	+/-4	62,650	Anthropic	Proprietary
5	Opus 4.7Anthropic	1,494	+/-4	47,222	Anthropic	Proprietary
6	muse-spark-1.1Meta	1,490	+/-10	3,750	Meta	Proprietary
7	Muse SparkFacebook AI研究实验室	1,488	+/-6	13,573	Facebook AI研究实验室	Proprietary
8	gpt-5.6-sol-xhighOpenAI	1,486	+/-14	1,740	OpenAI	Proprietary
9	Gemini 3.0 Pro (Preview 11-2025)Google Deep Mind	1,486	+/-4	41,308	Google Deep Mind	Proprietary
10	Gemini 3.1 Pro PreviewGoogle Deep Mind	1,485	+/-4	78,561	Google Deep Mind	Proprietary
11	Claude Opus 4.8 (thinking)Anthropic	1,482	+/-5	26,557	Anthropic	Proprietary
12	GPT-5.5 (high)OpenAI	1,481	+/-5	41,341	OpenAI	Proprietary
13	GPT-5.4 (high)OpenAI	1,476	+/-4	54,566	OpenAI	Proprietary
14	gemini-3.5-flash-highGoogle	1,476	+/-7	10,110	Google	Proprietary
15	gemini-3.5-flash-mediumGoogle	1,476	+/-7	9,492	Google	Proprietary
16	GPT-5.2OpenAI	1,476	+/-4	34,462	OpenAI	Proprietary
17	Qwen3.7-Max-Preview阿里巴巴	1,475	+/-10	3,719	阿里巴巴	Proprietary
18	Claude Opus 4.8Anthropic	1,475	+/-5	26,957	Anthropic	Proprietary
19	Grok 4.20 BetaxAI	1,475	+/-5	26,883	xAI	Proprietary
20	GPT-5.5OpenAI	1,474	+/-5	42,644	OpenAI	Proprietary
21	grok-4.20-beta-0309-reasoningxAI	1,474	+/-4	55,900	xAI	Proprietary
22	Gemini 3.0 FlashGoogle Deep Mind	1,473	+/-4	30,712	Google Deep Mind	Proprietary
23	GPT-5.5 InstantOpenAI	1,473	+/-5	26,138	OpenAI	Proprietary
24	Claude Opus 4 (thinking-32k)Anthropic	1,473	+/-4	37,064	Anthropic	Proprietary
25	GLM 5.1智谱AI	1,472	+/-5	26,549	智谱AI	MIT
26	Claude Sonnet 4.6Anthropic	1,472	+/-4	52,860	Anthropic	Proprietary
27	grok-4.20-multi-agent-beta-0309xAI	1,471	+/-4	54,737	xAI	Proprietary
28	Claude Opus 4Anthropic	1,469	+/-3	71,066	Anthropic	Proprietary
29	grok-4.5SpaceXAI	1,469	+/-11	3,224	SpaceXAI	Proprietary
30	ERNIE-5.1-Preview百度	1,468	+/-5	36,321	百度	Proprietary
31	mimo-v2.5-proXiaomi	1,466	+/-5	38,175	Xiaomi	MIT
32	Grok 4.1 ThinkingxAI	1,466	+/-3	65,529	xAI	Proprietary
33	GLM-5.2 (max)智谱AI	1,465	+/-6	13,442	智谱AI	MIT
34	GPT-5.4OpenAI	1,465	+/-4	57,271	OpenAI	Proprietary
35	Qwen3.5 Max Preview阿里巴巴	1,465	+/-5	21,507	阿里巴巴	Proprietary
36	claude-sonnet-5-highAnthropic	1,463	+/-7	9,008	Anthropic	Proprietary
37	Kimi K2.6Moonshot AI	1,462	+/-5	35,917	Moonshot AI	Modified MIT
38	Qwen3.6-Max-Preview阿里巴巴	1,460	+/-8	5,210	阿里巴巴	Proprietary
39	Gemini 3.0 Flash (minimal)Google Deep Mind	1,460	+/-3	79,866	Google Deep Mind	Proprietary
40	qwen3.7-plusAlibaba	1,460	+/-6	18,501	Alibaba	Proprietary
41	Grok 4.1xAI	1,460	+/-3	67,666	xAI	Proprietary
42	DeepSeek-V4-Pro (thinking)DeepSeek-AI	1,457	+/-5	39,019	DeepSeek-AI	MIT
43	GLM-5智谱AI	1,457	+/-4	27,818	智谱AI	MIT
44	DeepSeek-V4-ProDeepSeek-AI	1,456	+/-5	41,017	DeepSeek-AI	MIT
45	Claude Sonnet 4.5 (thinking-32k)Anthropic	1,456	+/-3	82,391	Anthropic	Proprietary
46	Claude Sonnet 4.5Anthropic	1,455	+/-3	80,788	Anthropic	Proprietary
47	DOLA Seed 2.0 Pro字节跳动Seed团队	1,455	+/-4	63,499	字节跳动Seed团队	Proprietary
48	GPT-5.1 Pro (high)OpenAI	1,455	+/-4	40,815	OpenAI	Proprietary
49	Gemma 4 31BDeepMind	1,451	+/-8	5,884	DeepMind	Apache 2.0
50	GPT-5.4 mini (high)OpenAI	1,449	+/-4	53,297	OpenAI	Proprietary
51	Kimi K2 ThinkingMoonshot AI	1,449	+/-4	59,062	Moonshot AI	Modified MIT
52	Opus 4.1 (thinking-16k)Anthropic	1,449	+/-3	49,772	Anthropic	Proprietary
53	ERNIE 5.0百度	1,449	+/-7	9,743	百度	Proprietary
54	GPT-5.3OpenAI	1,449	+/-4	33,037	OpenAI	Proprietary
55	mimo-v2-proXiaomi	1,448	+/-5	24,530	Xiaomi	Proprietary
56	ERNIE 5.0百度	1,447	+/-4	35,255	百度	Proprietary
57	Opus 4.1Anthropic	1,447	+/-3	77,272	Anthropic	Proprietary
58	Gemini 2.5 Pro Experimental 03-25Google Deep Mind	1,446	+/-2	124,468	Google Deep Mind	Proprietary
59	minimax-m3MiniMax	1,445	+/-6	23,823	MiniMax	MiniMax Community License
60	GPT-4.5OpenAI	1,445	+/-6	14,547	OpenAI	Proprietary
61	GPT-4o(2025-03-27)OpenAI	1,443	+/-3	82,415	OpenAI	Proprietary
62	Qwen 3.6 Plus Preview阿里巴巴	1,443	+/-4	40,143	阿里巴巴	Proprietary
63	Grok 4.3 BetaxAI	1,443	+/-4	41,890	xAI	Proprietary
64	GLM-4.7智谱AI	1,443	+/-6	12,103	智谱AI	MIT
65	Qwen3.5-397B-A17B阿里巴巴	1,442	+/-4	54,262	阿里巴巴	Apache 2.0
66	glm-5v-turboZ.ai	1,440	+/-10	3,358	Z.ai	Proprietary
67	GPT-5.1 InstantOpenAI	1,439	+/-4	43,434	OpenAI	Proprietary
68	DeepSeek-V4-Flash (thinking)DeepSeek-AI	1,439	+/-5	40,631	DeepSeek-AI	MIT
69	Gemma 4 26B A4BDeepMind	1,438	+/-8	5,806	DeepMind	Apache 2.0
70	DeepSeek-V4-FlashDeepSeek-AI	1,437	+/-4	40,831	DeepSeek-AI	MIT
71	GPT-5.2 Pro (high)OpenAI	1,437	+/-4	48,012	OpenAI	Proprietary
72	longcat-flash-chat-2602-expMeituan	1,436	+/-5	28,117	Meituan	Proprietary
73	GPT-5.2OpenAI	1,435	+/-3	73,109	OpenAI	Proprietary
74	Qwen3 Max (Preview)阿里巴巴	1,435	+/-4	27,707	阿里巴巴	Proprietary
75	GPT-5-Pro (high)OpenAI	1,434	+/-5	31,909	OpenAI	Proprietary
76	mimo-v2.5Xiaomi	1,434	+/-5	39,076	Xiaomi	MIT
77	gemini-3.1-flash-lite-previewGoogle	1,432	+/-4	60,963	Google	Proprietary
78	Kimi K2.5 InstantMoonshot AI	1,432	+/-7	8,179	Moonshot AI	Modified MIT
79	Grok 4.1 Fast (fast-reasoning)xAI	1,431	+/-3	56,807	xAI	Proprietary
80	OpenAI o3OpenAI	1,431	+/-4	59,711	OpenAI	Proprietary
81	mimo-v2-omniXiaomi	1,430	+/-6	19,533	Xiaomi	Proprietary
82	Kimi K2 Thinking (thinking-turbo)Moonshot AI	1,430	+/-3	62,027	Moonshot AI	Modified MIT
83	mistral-medium-3.5Mistral	1,427	+/-7	11,052	Mistral	Modified MIT
84	amazon-nova-experimental-chat-26-02-10Amazon	1,427	+/-10	3,421	Amazon	Proprietary
85	GPT-5OpenAI	1,427	+/-4	31,539	OpenAI	Proprietary
86	GLM-4.6智谱AI	1,425	+/-4	35,625	智谱AI	MIT
87	DeepSeek V3.2DeepSeek-AI	1,425	+/-4	47,243	DeepSeek-AI	MIT
88	DeepSeek V3.2-Exp (thinking)DeepSeek-AI	1,425	+/-7	9,066	DeepSeek-AI	MIT
89	Claude Opus 4 (thinking-16k)Anthropic	1,424	+/-4	36,864	Anthropic	Proprietary
90	qwen3-max-2025-09-23Alibaba	1,424	+/-6	9,152	Alibaba	Proprietary
91	Qwen3-235B-A22B-2507阿里巴巴	1,423	+/-3	97,160	阿里巴巴	Apache 2.0
92	nvidia-nemotron-3-ultra-550b-a55b-nvfp4Nvidia	1,423	+/-7	9,406	Nvidia	OpenMDW-1.1
93	DeepSeek V3.2 (thinking)DeepSeek-AI	1,423	+/-4	41,035	DeepSeek-AI	MIT
94	DeepSeek V3.2-ExpDeepSeek-AI	1,423	+/-6	11,921	DeepSeek-AI	MIT
95	DeepSeek-R1-0528DeepSeek-AI	1,422	+/-6	18,452	DeepSeek-AI	MIT
96	Grok 4 FastxAI	1,421	+/-8	6,811	xAI	Proprietary
97	ERNIE 5.0百度	1,419	+/-9	4,704	百度	Proprietary
98	Kimi K2 0905Moonshot AI	1,418	+/-6	11,774	Moonshot AI	Modified MIT
99	DeepSeek-V3.1 Terminus (thinking)DeepSeek-AI	1,418	+/-10	3,458	DeepSeek-AI	MIT
100	DeepSeek-V3.1DeepSeek-AI	1,418	+/-6	14,945	DeepSeek-AI	MIT
101	Kimi K2Moonshot AI	1,418	+/-5	27,613	Moonshot AI	Modified MIT
102	Qwen3.5-122B-A10B阿里巴巴	1,417	+/-4	28,517	阿里巴巴	Apache 2.0
103	DeepSeek-V3.1 (thinking)DeepSeek-AI	1,417	+/-7	11,728	DeepSeek-AI	MIT
104	MiniMax-M2.7MiniMaxAI	1,416	+/-4	46,070	MiniMaxAI	Modified MIT
105	Mistral Large 3MistralAI	1,416	+/-4	47,096	MistralAI	Apache 2.0
106	amazon-nova-experimental-chat-26-01-10Amazon	1,416	+/-10	3,407	Amazon	Proprietary
107	DeepSeek-V3.1 TerminusDeepSeek-AI	1,415	+/-10	3,692	DeepSeek-AI	MIT
108	Qwen3-VL-235B-A22B-Instruct阿里巴巴	1,415	+/-6	11,499	阿里巴巴	Apache 2.0
109	GPT-4.1OpenAI	1,414	+/-4	50,942	OpenAI	Proprietary
110	hunyuan-hy3-previewTencent	1,413	+/-8	6,654	Tencent	tencent-hunyuan-community
111	Claude Opus 4Anthropic	1,412	+/-4	44,188	Anthropic	Proprietary
112	Haiku 4.5Anthropic	1,412	+/-3	103,982	Anthropic	Proprietary
113	Grok 3xAI	1,412	+/-4	32,901	xAI	Proprietary
114	GLM-4.5智谱AI	1,411	+/-5	24,288	智谱AI	MIT
115	Gemini 2.5 FlashGoogle Deep Mind	1,410	+/-2	124,403	Google Deep Mind	Proprietary
116	Grok 4xAI	1,410	+/-4	41,350	xAI	Proprietary
117	Magistral-Medium-2506MistralAI	1,410	+/-3	93,892	MistralAI	Proprietary
118	Qwen3.5-27B阿里巴巴	1,409	+/-4	27,358	阿里巴巴	Apache 2.0
119	Gemini 2.5 Flash-Preview-09-2025Google Deep Mind	1,404	+/-4	32,892	Google Deep Mind	Proprietary
120	Grok 4 Fast (fast-reasoning)xAI	1,404	+/-5	18,708	xAI	Proprietary
121	GPT-5.4 nano (high)OpenAI	1,404	+/-4	52,277	OpenAI	Proprietary
122	qwen3-235b-a22b-no-thinkingAlibaba	1,403	+/-5	38,184	Alibaba	Apache 2.0
123	OpenAI o1OpenAI	1,402	+/-4	27,807	OpenAI	Proprietary
124	Qwen3-Next阿里巴巴	1,401	+/-5	22,855	阿里巴巴	Apache 2.0
125	longcat-flash-chatMeituan	1,401	+/-6	11,385	Meituan	MIT
126	Claude Sonnet 4 (thinking-32k)Anthropic	1,399	+/-4	35,096	Anthropic	Proprietary
127	qwen3-235b-a22b-thinking-2507Alibaba	1,399	+/-7	8,988	Alibaba	Apache 2.0
128	DeepSeek-R1DeepSeek-AI	1,398	+/-5	18,524	DeepSeek-AI	MIT
129	Step 3.5 FlashStepFunAI	1,398	+/-4	52,651	StepFunAI	Proprietary
130	Qwen3-VL-235B-A22B-Instruct (thinking)阿里巴巴	1,396	+/-7	7,943	阿里巴巴	Apache 2.0
131	DeepSeek-V3-0324DeepSeek-AI	1,396	+/-4	45,486	DeepSeek-AI	MIT
132	Qwen3.5-35B-A3B阿里巴巴	1,396	+/-4	29,184	阿里巴巴	Apache 2.0
133	hunyuan-vision-1.5-thinkingTencent	1,395	+/-12	2,218	Tencent	Proprietary
134	Step 3.5 FlashStepFunAI	1,395	+/-4	53,440	StepFunAI	Apache 2.0
135	amazon-nova-experimental-chat-12-10Amazon	1,394	+/-10	3,678	Amazon	Proprietary
136	mimo-v2-flash (non-thinking)Xiaomi	1,393	+/-4	46,619	Xiaomi	MIT
137	MiniMax M2.5MiniMaxAI	1,391	+/-4	41,172	MiniMaxAI	Modified MIT
138	GPT-5-mini (high)OpenAI	1,390	+/-5	27,008	OpenAI	Proprietary
139	OpenAI o4 - miniOpenAI	1,390	+/-4	45,421	OpenAI	Proprietary
140	Claude Sonnet 4Anthropic	1,389	+/-4	40,289	Anthropic	Proprietary
141	OpenAI o1OpenAI	1,388	+/-5	31,122	OpenAI	Proprietary
142	Qwen3-Coder-480B-A35B阿里巴巴	1,388	+/-5	25,692	阿里巴巴	Apache 2.0
143	Claude Sonnet 3.7 (thinking-32k)Anthropic	1,387	+/-4	38,814	Anthropic	Proprietary
144	mimo-v2-flash (thinking)Xiaomi	1,387	+/-6	10,947	Xiaomi	MIT
145	Hunyuan-T1腾讯AI实验室	1,387	+/-9	4,701	腾讯AI实验室	Proprietary
146	mistral-medium-2505Mistral	1,387	+/-5	33,209	Mistral	Proprietary
147	M2.1MiniMaxAI	1,384	+/-5	17,102	MiniMaxAI	MIT
148	Qwen3-30B-A3B-2507阿里巴巴	1,383	+/-5	23,720	阿里巴巴	Apache 2.0
149	GPT-4.1 miniOpenAI	1,383	+/-4	39,303	OpenAI	Proprietary
150	hunyuan-turbos-20250416Tencent	1,382	+/-6	10,724	Tencent	Proprietary
151	Gemini 2.5 Flash-Lite-Preview-09-2025 (no-thinking)Google Deep Mind	1,380	+/-3	47,198	Google Deep Mind	Proprietary
152	trinity-large-preview Apache 2.0	1,379	+/-4	30,083	—	—
153	GLM-4.6V智谱AI	1,377	+/-11	2,800	智谱AI	MIT
154	Qwen3-235B-A22B阿里巴巴	1,375	+/-5	26,259	阿里巴巴	Apache 2.0
155	Gemini 2.5 Flash-Lite (thinking)Google Deep Mind	1,374	+/-5	32,878	Google Deep Mind	Proprietary
156	Qwen2.5-Max阿里巴巴	1,374	+/-4	32,616	阿里巴巴	Proprietary
157	GLM-4.5-Air智谱AI	1,373	+/-4	31,061	智谱AI	MIT
158	Claude 3.5 SonnetAnthropic	1,373	+/-3	88,325	Anthropic	Proprietary
159	Claude Sonnet 3.7Anthropic	1,371	+/-4	43,170	Anthropic	Proprietary
160	Qwen3-Next (thinking)阿里巴巴	1,370	+/-6	13,676	阿里巴巴	Apache 2.0
161	trinity-large-thinking Apache 2.0	1,369	+/-5	29,192	—	—
162	GLM-4.7-Flash智谱AI	1,368	+/-6	11,724	智谱AI	MIT
163	amazon-nova-experimental-chat-11-10Amazon	1,367	+/-4	25,358	Amazon	Proprietary
164	Gemma 3 - 27B (IT)Google Deep Mind	1,366	+/-4	47,514	Google Deep Mind	Gemma
165	minimax-m1MiniMax	1,364	+/-4	35,170	MiniMax	Apache 2.0
166	OpenAI o3-mini (high)OpenAI	1,364	+/-5	18,589	OpenAI	Proprietary
167	OpenAI o3-mini (high)OpenAI	1,362	+/-5	16,952	OpenAI	Proprietary
168	nvidia-nemotron-3-super-120b-a12bNvidia	1,361	+/-7	7,545	Nvidia	NVIDIA Open Model
169	Gemini 2.0 Flash ExperimentalDeepMind	1,360	+/-4	43,743	DeepMind	Proprietary
170	DeepSeek-V3DeepSeek-AI	1,359	+/-5	21,770	DeepSeek-AI	DeepSeek
171	Mistral-Small-3.2MistralAI	1,358	+/-5	17,699	MistralAI	Apache 2.0
172	grok-3-mini-betaxAI	1,357	+/-5	22,694	xAI	Proprietary
173	intellect-3 MIT	1,356	+/-8	5,328	—	—
174	C4AI Command A (202503)CohereAI	1,354	+/-3	56,224	CohereAI	CC-BY-NC-4.0
175	GLM-4.5V智谱AI	1,354	+/-8	4,955	智谱AI	MIT
176	Gemini 2.0 Flash-LiteDeepMind	1,354	+/-4	24,955	DeepMind	Proprietary
177	GPT OSS 120BOpenAI	1,353	+/-4	30,628	OpenAI	Apache 2.0
178	Gemini 1.5 ProGoogle Deep Mind	1,351	+/-3	55,606	Google Deep Mind	Proprietary
179	amazon-nova-experimental-chat-10-20Amazon	1,350	+/-6	11,467	Amazon	Proprietary
180	hunyuan-turbos-20250226Tencent	1,349	+/-12	2,220	Tencent	Proprietary
181	Step3StepFunAI	1,348	+/-7	6,534	StepFunAI	Apache 2.0
182	amazon-nova-experimental-chat-10-09Amazon	1,348	+/-11	2,824	Amazon	Proprietary
183	OpenAI o3-miniOpenAI	1,348	+/-4	57,317	OpenAI	Proprietary
184	llama-3.1-nemotron-ultra-253b-v1Nvidia	1,348	+/-12	2,549	Nvidia	Nvidia Open Model
185	Qwen3-32B阿里巴巴	1,347	+/-9	3,926	阿里巴巴	Apache 2.0
186	mercury-2 InceptionAI	1,347	+/-11	3,121	AI	Proprietary
187	ling-flash-2.0 AntGroup	1,346	+/-7	7,002	Group	MIT
188	qwen-plus-0125Alibaba	1,346	+/-8	5,819	Alibaba	Proprietary
189	MiniMax M2MiniMaxAI	1,346	+/-8	6,866	MiniMaxAI	Apache 2.0
190	GPT-4oOpenAI	1,346	+/-3	112,881	OpenAI	Proprietary
191	nvidia-llama-3.3-nemotron-super-49b-v1.5Nvidia	1,343	+/-10	3,344	Nvidia	Nvidia Open
192	glm-4-plus-0111Zhipu	1,343	+/-8	5,760	Zhipu	Proprietary
193	Claude 3.5 SonnetAnthropic	1,342	+/-3	82,419	Anthropic	Proprietary
194	Gemma 3 - 12B (IT)Google Deep Mind	1,342	+/-10	3,829	Google Deep Mind	Gemma
195	hunyuan-turbo-0110Tencent	1,341	+/-12	2,290	Tencent	Proprietary
196	GPT-5-Nano (high)OpenAI	1,337	+/-7	8,259	OpenAI	Proprietary
197	OpenAI o1-miniOpenAI	1,337	+/-4	51,981	OpenAI	Proprietary
198	Nova 2 Lite亚马逊	1,337	+/-6	12,219	亚马逊	Proprietary
199	QwQ-32B阿里巴巴	1,336	+/-4	25,382	阿里巴巴	Apache 2.0
200	Grok 2xAI	1,336	+/-4	63,498	xAI	Proprietary
201	gemini-advanced-0514Google	1,335	+/-5	50,148	Google	Proprietary
202	GPT-4oOpenAI	1,335	+/-4	45,499	OpenAI	Proprietary
203	llama-3.1-405b-instruct-bf16Meta	1,335	+/-4	41,375	Meta	Llama 3.1 Community
204	step-2-16k-exp-202412StepFun	1,334	+/-9	4,833	StepFun	Proprietary
205	llama-3.1-405b-instruct-fp8Meta	1,333	+/-4	59,656	Meta	Llama 3.1 Community
206	olmo-3.1-32b-instructAi2	1,330	+/-6	12,211	Ai2	Apache 2.0
207	yi-lightning Proprietary	1,328	+/-5	27,332	—	—
208	llama-3.3-nemotron-49b-super-v1Nvidia	1,328	+/-12	2,218	Nvidia	Nvidia
209	molmo-2-8bAi2	1,328	+/-21	800	Ai2	Apache 2.0
210	Qwen3-30B-A3B阿里巴巴	1,327	+/-5	26,474	阿里巴巴	Apache 2.0
211	Llama 4 Maverick InstructFacebook AI研究实验室	1,327	+/-4	39,963	Facebook AI研究实验室	Llama 4
212	hunyuan-large-2025-02-10Tencent	1,326	+/-10	3,738	Tencent	Proprietary
213	gpt-4-turbo-2024-04-09OpenAI	1,324	+/-4	98,114	OpenAI	Proprietary
214	Claude 3.5 HaikuAnthropic	1,324	+/-3	69,933	Anthropic	Proprietary
215	Gemini 1.5 ProGoogle Deep Mind	1,324	+/-4	79,138	Google Deep Mind	Proprietary
216	deepseek-v2.5-1210DeepSeek	1,323	+/-8	6,795	DeepSeek	DeepSeek
217	Llama 4 Scout InstructFacebook AI研究实验室	1,323	+/-5	30,280	Facebook AI研究实验室	Llama
218	GPT-4.1 nanoOpenAI	1,322	+/-8	6,103	OpenAI	Proprietary
219	Claude3-OpusAnthropic	1,321	+/-3	194,909	Anthropic	Proprietary
220	ring-flash-2.0 AntGroup	1,321	+/-7	7,135	Group	MIT
221	step-1o-turbo-202506StepFun	1,320	+/-7	9,034	StepFun	Proprietary
222	glm-4-plusZhipu AI	1,319	+/-5	26,126	Zhipu AI	Proprietary
223	Llama3.3-70B-InstructFacebook AI研究实验室	1,318	+/-3	54,726	Facebook AI研究实验室	Llama-3.3
224	Gemma-3n-E4BGoogle Deep Mind	1,318	+/-5	22,568	Google Deep Mind	Gemma
225	qwen-max-0919Alibaba	1,318	+/-6	16,478	Alibaba	Qwen
226	GPT-4o miniOpenAI	1,318	+/-4	68,709	OpenAI	Proprietary
227	GPT OSS 20BOpenAI	1,317	+/-6	10,621	OpenAI	Apache 2.0
228	nvidia-nemotron-3-nano-30b-a3b-bf16Nvidia	1,316	+/-6	15,509	Nvidia	NVIDIA Open Model
229	qwen2.5-plus-1127Alibaba	1,315	+/-6	10,187	Alibaba	Proprietary
230	athene-v2-chat NexusFlow	1,314	+/-5	24,739	—	—
231	mistral-large-2407Mistral	1,314	+/-4	45,459	Mistral	Mistral Research
232	GPT-4OpenAI	1,313	+/-4	93,439	OpenAI	Proprietary
233	GPT-4OpenAI	1,312	+/-4	100,105	OpenAI	Proprietary
234	hunyuan-standard-2025-02-10Tencent	1,311	+/-10	3,904	Tencent	Proprietary
235	gemini-1.5-flash-002Google	1,309	+/-4	34,902	Google	Proprietary
236	grok-2-mini-2024-08-13xAI	1,308	+/-4	52,567	xAI	Proprietary
237	DeepSeek V2.5DeepSeek-AI	1,307	+/-5	24,572	DeepSeek-AI	DeepSeek
238	granite-4.1-8bIBM	1,307	+/-10	4,067	IBM	Apache 2.0
239	athene-70b-0725 CC-BY-NC-4.0	1,306	+/-6	19,621	—	—
240	mercury InceptionAI	1,306	+/-14	1,954	AI	Proprietary
241	olmo-3-32b-thinkAi2	1,306	+/-8	5,941	Ai2	Apache 2.0
242	mistral-large-2411Mistral	1,305	+/-4	28,073	Mistral	MRL
243	Magistral-Medium-2506MistralAI	1,304	+/-6	11,625	MistralAI	Proprietary
244	Gemma 3 - 4B (IT)Google Deep Mind	1,303	+/-9	4,171	Google Deep Mind	Gemma
245	Mistral-Small-3.1-24B-Instruct-2503MistralAI	1,303	+/-5	33,199	MistralAI	Apache 2.0
246	Qwen2.5-VL-72B-Instruct阿里巴巴	1,303	+/-4	39,406	阿里巴巴	Qwen
247	Llama3.1-70B-InstructFacebook AI研究实验室	1,299	+/-8	7,140	Facebook AI研究实验室	Llama 3.1
248	hunyuan-large-visionTencent	1,294	+/-9	5,373	Tencent	Proprietary
249	Llama3.1-70B-InstructFacebook AI研究实验室	1,293	+/-4	55,240	Facebook AI研究实验室	Llama 3.1 Community
250	amazon-nova-pro-v1.0Amazon	1,290	+/-5	24,745	Amazon	Proprietary
251	jamba-1.5-large Jamba Open	1,289	+/-7	8,662	—	—
252	gemma-2-27b-itGoogle	1,289	+/-3	75,754	Google	Gemma license
253	reka-core-20240904 Proprietary	1,288	+/-7	7,312	—	—
254	ibm-granite-h-smallIBM	1,287	+/-8	5,681	IBM	Apache 2.0
255	GPT-4OpenAI	1,287	+/-5	54,173	OpenAI	Proprietary
256	gemini-1.5-flash-001Google	1,286	+/-5	62,833	Google	Proprietary
257	llama-3.1-tulu-3-70bAi2	1,286	+/-10	2,846	Ai2	Llama 3.1
258	llama-3.1-nemotron-51b-instructNvidia	1,286	+/-10	3,749	Nvidia	Llama 3.1
259	olmo-3.1-32b-thinkAi2	1,285	+/-7	8,499	Ai2	Apache 2.0
260	Claude3-SonnetAnthropic	1,281	+/-4	109,284	Anthropic	Proprietary
261	gemma-2-9b-it-simpo MIT	1,280	+/-7	10,072	—	—
262	nemotron-4-340b-instructNvidia	1,277	+/-5	19,659	Nvidia	NVIDIA Open Model
263	Llama3-70B-InstructFacebook AI研究实验室	1,276	+/-4	156,876	Facebook AI研究实验室	Llama 3 Community
264	command-r-plus-08-2024Cohere	1,276	+/-7	9,866	Cohere	CC-BY-NC-4.0
265	GPT-4OpenAI	1,275	+/-4	88,723	OpenAI	Proprietary
266	Mistral Small 24B Instruct 2501MistralAI	1,274	+/-6	14,681	MistralAI	Apache 2.0
267	GLM4智谱AI	1,273	+/-7	9,788	智谱AI	Proprietary
268	reka-flash-20240904 Proprietary	1,272	+/-7	7,536	—	—
269	Qwen2.5-Coder-32B-Instruct阿里巴巴	1,270	+/-8	5,432	阿里巴巴	Apache 2.0
270	C4AI Aya Vision 32BCohereAI	1,267	+/-5	27,124	CohereAI	CC-BY-NC-4.0
271	gemma-2-9b-itGoogle	1,266	+/-4	54,611	Google	Gemma license
272	deepseek-coder-v2DeepSeek	1,265	+/-6	15,147	DeepSeek	DeepSeek License
273	Qwen2-72B-Instruct阿里巴巴	1,261	+/-5	37,325	阿里巴巴	Qianwen LICENSE
274	C4AI Command R+CohereAI	1,261	+/-4	77,554	CohereAI	CC-BY-NC-4.0
275	Claude3-HaikuAnthropic	1,261	+/-4	117,701	Anthropic	Proprietary
276	amazon-nova-lite-v1.0Amazon	1,260	+/-5	19,372	Amazon	Proprietary
277	gemini-1.5-flash-8b-001Google	1,259	+/-4	35,558	Google	Proprietary
278	Phi 4 - 14BMicrosoft Azure	1,256	+/-5	24,126	Microsoft Azure	MIT
279	olmo-2-0325-32b-instructAi2	1,251	+/-11	3,334	Ai2	Apache-2.0
280	command-r-08-2024Cohere	1,250	+/-7	10,140	Cohere	CC-BY-NC-4.0
281	mistral-large-2402Mistral	1,242	+/-5	62,436	Mistral	Proprietary
282	amazon-nova-micro-v1.0Amazon	1,241	+/-5	19,364	Amazon	Proprietary
283	jamba-1.5-mini Jamba Open	1,239	+/-7	8,858	—	—
284	ministral-8b-2410Mistral	1,237	+/-9	4,781	Mistral	MRL
285	gemini-pro-dev-apiGoogle	1,236	+/-7	18,354	Google	Proprietary
286	Qwen1.5-110B-Chat阿里巴巴	1,233	+/-6	26,195	阿里巴巴	Qianwen LICENSE
287	hunyuan-standard-256kTencent	1,233	+/-12	2,728	Tencent	Proprietary
288	reka-flash-21b-20240226-online Proprietary	1,233	+/-7	15,450	—	—
289	Qwen1.5-72B-Chat阿里巴巴	1,233	+/-5	39,302	阿里巴巴	Qianwen LICENSE
290	Mixtral-8x22B-Instruct-v0.1MistralAI	1,229	+/-5	51,416	MistralAI	Apache 2.0
291	command-rCohere	1,226	+/-5	54,036	Cohere	CC-BY-NC-4.0
292	reka-flash-21b-20240226 Proprietary	1,226	+/-6	24,806	—	—
293	gpt-3.5-turbo-0125OpenAI	1,224	+/-5	66,207	OpenAI	Proprietary
294	Llama3-8B-InstructFacebook AI研究实验室	1,223	+/-4	104,642	Facebook AI研究实验室	Llama 3 Community
295	C4AI Aya Vision 8BCohereAI	1,223	+/-7	9,818	CohereAI	CC-BY-NC-4.0
296	Gemini-proDeepMind	1,222	+/-12	6,390	DeepMind	Proprietary
297	mistral-mediumMistral	1,222	+/-5	34,550	Mistral	Proprietary
298	llama-3.1-tulu-3-8bAi2	1,220	+/-11	2,896	Ai2	Llama 3.1
299	yi-1.5-34b-chat Apache-2.0	1,213	+/-5	24,146	—	—
300	zephyr-orpo-141b-A35b-v0.1 Apache 2.0	1,212	+/-11	4,652	—	—
301	Llama3.1-8B-InstructFacebook AI研究实验室	1,211	+/-4	49,605	Facebook AI研究实验室	Llama 3.1 Community
302	Llama3.1-8B-InstructFacebook AI研究实验室	1,208	+/-11	3,090	Facebook AI研究实验室	Apache 2.0
303	qwen1.5-32b-chatAlibaba	1,203	+/-6	21,741	Alibaba	Qianwen LICENSE
304	gpt-3.5-turbo-1106OpenAI	1,203	+/-9	16,619	OpenAI	Proprietary
305	gemma-2-2b-itGoogle	1,200	+/-4	46,616	Google	Gemma license
306	Phi-3-medium 14B-previewMicrosoft Azure	1,197	+/-5	25,055	Microsoft Azure	MIT
307	mixtral-8x7b-instruct-v0.1Mistral	1,196	+/-4	73,503	Mistral	Apache 2.0
308	dbrx-instruct-preview DBRX LICENSE	1,194	+/-6	32,191	—	—
309	internlm2_5-20b-chat Other	1,191	+/-7	9,901	—	—
310	Qwen1.5-14B-Chat阿里巴巴	1,190	+/-7	17,839	阿里巴巴	Qianwen LICENSE
311	WizardLM-70B-V1.0WizardLM Team	1,184	+/-9	8,214	WizardLM Team	Llama 2 Community
312	DeepSeek LLM 67B ChatDeepSeek-AI	1,184	+/-11	4,932	DeepSeek-AI	DeepSeek License
313	yi-34b-chat Yi License	1,183	+/-7	15,483	—	—
314	granite-3.0-8b-instructIBM	1,182	+/-9	6,638	IBM	Apache 2.0
315	openchat-3.5 Apache-2.0	1,182	+/-10	7,968	—	—
316	openchat-3.5-0106 Apache-2.0	1,182	+/-8	12,637	—	—
317	Gemma 1.1-7B-ITGoogle Research	1,182	+/-6	23,893	Google Research	Gemma license
318	snowflake-arctic-instruct Apache 2.0	1,179	+/-6	32,832	—	—
319	granite-3.1-2b-instructIBM	1,178	+/-11	3,188	IBM	Apache 2.0
320	tulu-2-dpo-70b AI2 ImpACT Low-risk	1,177	+/-10	6,535	—	—
321	openhermes-2.5-mistral-7b Apache-2.0	1,175	+/-10	5,006	—	—
322	vicuna-33b Non-commercial	1,172	+/-6	22,479	—	—
323	starling-lm-7b-beta Apache-2.0	1,171	+/-7	16,056	—	—
324	Phi-3-small 7BMicrosoft Azure	1,170	+/-6	17,766	Microsoft Azure	MIT
325	llama-2-70b-chatMeta	1,170	+/-6	38,492	Meta	Llama 2 Community
326	starling-lm-7b-alpha CC-BY-NC-4.0	1,167	+/-8	10,224	—	—
327	llama-3.2-3b-instructMeta	1,166	+/-8	7,936	Meta	Llama 3.2
328	nous-hermes-2-mixtral-8x7b-dpo Apache-2.0	1,164	+/-12	3,777	—	—
329	Qwen3-VL-2B阿里巴巴	1,156	+/-8	6,837	阿里巴巴	Apache 2.0
330	QwQ-32B-Preview阿里巴巴	1,155	+/-11	3,231	阿里巴巴	Apache 2.0
331	llama2-70b-steerlm-chatNvidia	1,154	+/-13	3,585	Nvidia	Llama 2 Community
332	solar-10.7b-instruct-v1.0 CC-BY-NC-4.0	1,152	+/-13	4,155	—	—
333	dolphin-2.2.1-mistral-7b Apache-2.0	1,151	+/-15	1,679	—	—
334	mpt-30b-chat CC-BY-NC-SA-4.0	1,150	+/-12	2,572	—	—
335	Mistral-7B-Instruct-v0.2MistralAI	1,149	+/-7	19,402	MistralAI	Apache-2.0
336	wizardlm-13bMicrosoft	1,149	+/-9	7,044	Microsoft	Llama 2 Community
337	falcon-180b-chat Falcon-180B TII License	1,147	+/-17	1,295	—	—
338	Qwen1.5-7B-Chat阿里巴巴	1,143	+/-10	4,737	阿里巴巴	Qianwen LICENSE
339	Phi-3-mini 3.8BMicrosoft Azure	1,142	+/-6	12,297	Microsoft Azure	MIT
340	Baichuan2-13B-Chat百川智能	1,141	+/-7	19,174	百川智能	Llama 2 Community
341	vicuna-13b Llama 2 Community	1,140	+/-7	19,367	—	—
342	Qwen-14B-Chat阿里巴巴	1,138	+/-11	4,964	阿里巴巴	Qianwen LICENSE
343	PaLM 2Google Research	1,138	+/-9	8,554	Google Research	Proprietary
344	Gemma 7B - ItGoogle Research	1,137	+/-9	8,925	Google Research	Gemma license
345	CodeLLaMA-34BFacebook AI研究实验室	1,136	+/-9	7,366	Facebook AI研究实验室	Llama 2 Community
346	zephyr-7b-beta MIT	1,130	+/-9	11,118	—	—
347	Phi-3-mini 3.8BMicrosoft Azure	1,129	+/-7	20,685	Microsoft Azure	MIT
348	Phi-3-mini 3.8BMicrosoft Azure	1,127	+/-6	20,118	Microsoft Azure	MIT
349	guanaco-33b Non-commercial	1,127	+/-12	2,921	—	—
350	zephyr-7b-alpha MIT	1,126	+/-16	1,785	—	—
351	stripedhyena-nous-7b Apache 2.0	1,120	+/-11	5,182	—	—
352	CodeLlama-70B-InstructFacebook AI研究实验室	1,118	+/-18	1,143	Facebook AI研究实验室	Llama 2 Community
353	Gemma 1.1-2B-ITGoogle Research	1,116	+/-8	10,854	Google Research	Gemma license
354	vicuna-7b Llama 2 Community	1,114	+/-9	6,923	—	—
355	smollm2-1.7b-instruct Apache 2.0	1,114	+/-14	2,199	—	—
356	llama-3.2-1b-instructMeta	1,111	+/-8	8,045	Meta	Llama 3.2
357	Mistral 7B InstructMistralAI	1,109	+/-9	8,977	MistralAI	Apache 2.0
358	Baichuan2-7B-Chat百川智能	1,107	+/-7	14,148	百川智能	Llama 2 Community
359	Gemma 2B - ItGoogle Research	1,093	+/-11	4,780	Google Research	Gemma license
360	Qwen1.5-4B-Chat阿里巴巴	1,090	+/-9	7,597	阿里巴巴	Qianwen LICENSE
361	olmo-7b-instructAi2	1,073	+/-11	6,328	Ai2	Apache-2.0
362	koala-13b Non-commercial	1,070	+/-10	6,965	—	—
363	alpaca-13b Non-commercial	1,068	+/-11	5,745	—	—
364	gpt4all-13b-snoozy Non-commercial	1,066	+/-15	1,743	—	—
365	mpt-7b-chat CC-BY-NC-SA-4.0	1,062	+/-12	3,924	—	—
366	chatglm3-6b Apache-2.0	1,055	+/-12	4,658	—	—
367	RWKV-4-Raven-14B Apache 2.0	1,041	+/-11	4,845	—	—
368	chatglm2-6b Apache-2.0	1,024	+/-14	2,658	—	—
369	oasst-pythia-12b Apache 2.0	1,022	+/-11	6,310	—	—
370	chatglm-6b Non-commercial	995	+/-13	4,914	—	—
371	fastchat-t5-3b Apache 2.0	991	+/-12	4,203	—	—
372	dolly-v2-12b MIT	981	+/-14	3,412	—	—
373	LLaMA 13BFacebook AI研究实验室	973	+/-16	2,391	Facebook AI研究实验室	Non-commercial
374	stablelm-tuned-alpha-7b CC-BY-NC-SA-4.0	952	+/-13	3,287	—	—