LMArena 评测赛道

LMArena Coding Arena 代码能力排行榜

Name: LMArena Coding Arena 代码能力排行榜
Creator: DataLearner
License: https://creativecommons.org/licenses/by/4.0/

基于 LMArena Coding Arena 用户匿名投票的最新AI大模型代码编程能力排行榜，涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

Kimi K3

最高得分

1529.00

模型数量

371

数据版本

2026年07月16日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前 AI 大模型在代码编程任务中的实力排名。数据来源于 LMArena （前身为 LMSYS Chatbot Arena）的 Coding 子赛道，通过真实用户匿名盲测投票评估各模型在代码编程任务中的表现。

评测方法概要

匿名盲测：用户发出编程问题后，由两个"隐藏身份"的模型分别给出代码解答，用户投票选出更好的回答，排除品牌偏见。

Elo 评分：采用 Bradley-Terry 模型计算 Elo 分数，分数越高说明该模型的代码回答越容易被用户选择。

覆盖多种编程场景：包括代码生成、Bug 修复、算法实现、代码解释等高频真实编程场景。

DataLearner 在原始数据基础上提供中文解读与深度分析，并将排行榜模型关联至 DataLearner 模型库，方便您一键查看模型详情、API 定价、评测得分等完整信息。

来源：全部国产模型

榜单历史快照月份:

排名总表

排名	模型名称	得分	95% CI	投票数	机构	许可证
10	Kimi K3Moonshot AI	1529.00	+/-22	798	Moonshot AI	Proprietary
26	Kimi K2.6Moonshot AI	1515.00	+/-7	10,359	Moonshot AI	Modified MIT
45	Kimi K2.5 InstantMoonshot AI	1504.00	+/-14	1,802	Moonshot AI	Modified MIT
47	DeepSeek-V4-ProDeepSeek-AI	1502.00	+/-7	12,705	DeepSeek-AI	MIT
49	Kimi K2 ThinkingMoonshot AI	1502.00	+/-6	16,650	Moonshot AI	Modified MIT
50	MiniMax M3MiniMaxAI	1500.00	+/-8	7,543	MiniMaxAI	MiniMax Community License
60	DeepSeek-V4-Pro (thinking)DeepSeek-AI	1492.00	+/-7	11,960	DeepSeek-AI	MIT
70	Kimi K2 Thinking (thinking-turbo)Moonshot AI	1487.00	+/-6	14,832	Moonshot AI	Modified MIT
72	DeepSeek-V4-FlashDeepSeek-AI	1482.00	+/-7	12,454	DeepSeek-AI	MIT
76	DeepSeek-V4-Flash (thinking)DeepSeek-AI	1482.00	+/-7	12,406	DeepSeek-AI	MIT
79	MiniMax-M2.7MiniMaxAI	1479.00	+/-6	13,908	MiniMaxAI	Modified MIT
82	DeepSeek V3.2-Exp (thinking)DeepSeek-AI	1475.00	+/-7	8,535	DeepSeek-AI	MIT
83	DeepSeek V3.2-Exp (thinking)DeepSeek-AI	1475.00	+/-13	1,918	DeepSeek-AI	MIT
84	qwen3-max-2025-09-23Alibaba	1474.00	+/-13	2,040	Alibaba	Proprietary
91	DeepSeek V3.2DeepSeek-AI	1470.00	+/-6	10,604	DeepSeek-AI	MIT
95	Kimi K2 0905Moonshot AI	1467.00	+/-13	2,241	Moonshot AI	Modified MIT
97	DeepSeek V3.2-ExpDeepSeek-AI	1465.00	+/-12	2,495	DeepSeek-AI	MIT
99	DeepSeek-R1-0528DeepSeek-AI	1465.00	+/-11	2,725	DeepSeek-AI	MIT
102	DeepSeek-V3.1 Terminus (thinking)DeepSeek-AI	1463.00	+/-24	635	DeepSeek-AI	MIT
105	Kimi K2Moonshot AI	1460.00	+/-8	5,237	Moonshot AI	Modified MIT
106	hunyuan-hy3-previewTencent	1460.00	+/-14	1,967	Tencent	tencent-hunyuan-community
113	DeepSeek-V3.1 (thinking)DeepSeek-AI	1457.00	+/-13	1,903	DeepSeek-AI	MIT
120	Step 3.5 FlashStepFunAI	1450.00	+/-6	13,482	StepFunAI	Apache 2.0
123	DeepSeek-V3.1DeepSeek-AI	1448.00	+/-12	2,623	DeepSeek-AI	MIT
126	qwen3-235b-a22b-no-thinkingAlibaba	1446.00	+/-8	6,970	Alibaba	Apache 2.0
127	DeepSeek-R1DeepSeek-AI	1445.00	+/-12	2,317	DeepSeek-AI	MIT
128	MiniMax M2.5MiniMaxAI	1444.00	+/-7	10,887	MiniMaxAI	Modified MIT
130	qwen3-235b-a22b-thinking-2507Alibaba	1442.00	+/-15	1,611	Alibaba	Apache 2.0
133	M2.1MiniMaxAI	1439.00	+/-10	3,415	MiniMaxAI	MIT
134	DeepSeek-V3.1 TerminusDeepSeek-AI	1439.00	+/-21	778	DeepSeek-AI	MIT
135	Step 3.5 FlashStepFunAI	1438.00	+/-6	15,542	StepFunAI	Proprietary
137	hunyuan-vision-1.5-thinkingTencent	1437.00	+/-27	437	Tencent	Proprietary
152	DeepSeek-V3-0324DeepSeek-AI	1429.00	+/-7	8,362	DeepSeek-AI	MIT
161	minimax-m1MiniMax	1416.00	+/-8	6,482	MiniMax	Apache 2.0
169	Step3StepFunAI	1408.00	+/-17	1,231	StepFunAI	Apache 2.0
174	hunyuan-turbos-20250226Tencent	1400.00	+/-31	275	Tencent	Proprietary
180	hunyuan-turbos-20250416Tencent	1394.00	+/-14	1,776	Tencent	Proprietary
187	DeepSeek-V3DeepSeek-AI	1388.00	+/-10	3,280	DeepSeek-AI	DeepSeek
193	MiniMax M2MiniMaxAI	1385.00	+/-15	1,544	MiniMaxAI	Apache 2.0
198	qwen-plus-0125Alibaba	1380.00	+/-18	893	Alibaba	Proprietary
200	deepseek-v2.5-1210DeepSeek	1375.00	+/-17	1,079	DeepSeek	DeepSeek
203	hunyuan-turbo-0110Tencent	1372.00	+/-30	299	Tencent	Proprietary
204	step-2-16k-exp-202412StepFun	1371.00	+/-20	737	StepFun	Proprietary
209	DeepSeek V2.5DeepSeek-AI	1368.00	+/-9	4,252	DeepSeek-AI	DeepSeek
212	hunyuan-large-2025-02-10Tencent	1367.00	+/-25	519	Tencent	Proprietary
222	qwen2.5-plus-1127Alibaba	1357.00	+/-14	1,553	Alibaba	Proprietary
224	hunyuan-large-visionTencent	1356.00	+/-19	963	Tencent	Proprietary
228	step-1o-turbo-202506StepFun	1353.00	+/-15	1,505	StepFun	Proprietary
229	qwen-max-0919Alibaba	1353.00	+/-11	2,756	Alibaba	Qwen
230	glm-4-plusZhipu AI	1352.00	+/-9	4,449	Zhipu AI	Proprietary
240	deepseek-coder-v2DeepSeek	1342.00	+/-12	2,671	DeepSeek	DeepSeek License
247	hunyuan-standard-2025-02-10Tencent	1332.00	+/-24	549	Tencent	Proprietary
249	glm-4-plus-0111Zhipu	1330.00	+/-18	894	Zhipu	Proprietary
270	hunyuan-standard-256kTencent	1301.00	+/-25	497	Tencent	Proprietary
296	qwen1.5-32b-chatAlibaba	1261.00	+/-11	3,930	Alibaba	Qianwen LICENSE
316	DeepSeek LLM 67B ChatDeepSeek-AI	1217.00	+/-24	649	DeepSeek-AI	DeepSeek License