DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜Arcada Labs Code Categories Arena 代码能力排行榜

Arcada Labs Code Categories Arena 代码能力排行榜

基于 Arcada Labs Code Categories Arena 用户匿名投票的最新AI大模型代码能力排行榜,通过 Bradley-Terry 模型对 Website、UI Component、Game Dev、Data Visualization 等代码子类别进行综合评分与排名。

榜首模型

Kimi K2.6

最高得分

1332.00

模型数量

129

数据版本

2026年06月13日

数据来源: Arcada Labs

来源:全部国产模型
榜单历史快照月份:

排名总表

排名模型名称得分95% CI投票数机构许可证
6Moonshot AIKimi K2.6Moonshot AI1332.00+/-5.419,693Moonshot AIOpen Source
11MiniMaxMiniMax M3MiniMax1315.00+/-9.25,954MiniMaxOpen Source
17DeepSeek-AIDeepSeek-V4-ProDeepSeek-AI1297.00+/-6.612,237DeepSeek-AIOpen Source
21Moonshot AIKimi K2.5 (thinking)Moonshot AI1288.00+/-4.235,262Moonshot AIOpen Source
23MiniMaxAIMiniMax-M2.7MiniMaxAI1282.00+/-4.726,278MiniMaxAIOpen Source
30DeepSeek-AIDeepSeek-V4-FlashDeepSeek-AI1264.00+/-5.319,662DeepSeek-AIOpen Source
32MiniMaxAIMiniMax M2.5MiniMaxAI1258.00+/-6.711,504MiniMaxAIOpen Source
35MiniMaxAIM2.1MiniMaxAI1242.00+/-5.120,803MiniMaxAIOpen Source
44DeepSeek-AIDeepSeek-V3.1 (thinking)DeepSeek-AI1227.00+/-5.716,258DeepSeek-AIOpen Source
47DeepSeek-AIDeepSeek V3.2-ExpDeepSeek-AI1222.00+/-5.219,490DeepSeek-AIOpen Source
52DeepSeek-AIDeepSeek V3.2DeepSeek-AI1218.00+/-4.824,314DeepSeek-AIOpen Source
53StepFunStep 3.7 FlashStepFun1218.00+/-8.47,214StepFunOpen Source
71DeepSeek-AIDeepSeek-R1-0528DeepSeek-AI1190.00+/-5.417,944DeepSeek-AIOpen Source
74MiniMaxAIMiniMax M2MiniMaxAI1186.00+/-6.810,828MiniMaxAIOpen Source
81DeepSeek-AIDeepSeek-V3.1DeepSeek-AI1163.00+/-5.120,278DeepSeek-AIOpen Source
83DeepSeek-AIDeepSeek-V3-0324DeepSeek-AI1160.00+/-5.219,257DeepSeek-AIOpen Source
87Moonshot AIKimi K2 0905Moonshot AI1149.00+/-17.91,504Moonshot AIOpen Source
92Moonshot AIKimi K2 Turbo PreviewMoonshot AI1135.00+/-15.22,094Moonshot AIOpen Source
103Moonshot AIKimi K2Moonshot AI1085.00+/-19.41,352Moonshot AIOpen Source
105AlibabaQwen3-235B-A22B-Thinking-2507Alibaba1084.00+/-9.16,169AlibabaOpen Source

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。

关于本榜单

本榜单数据来源于Design Arena,由 Y Combinator 支持的 Arcada Labs 开发,是专注于评测 AI 设计代码生成能力的众包匿名对战平台。

与 LMArena 评测通用文本和编程能力不同,Design Arena 的代码榜专门考察模型生成具有视觉呈现效果的前端代码的能力。平台将代码任务细分为 Website、UI 组件、游戏开发、数据可视化、SVG、Web App、移动端等多个子类别,每个子类别均有独立排行。

本页展示的是 Code Categories 综合榜,即将所有子类别的用户投票混合汇总后,统一用 Bradley-Terry 模型(类 Elo 算法)计算出的综合排名。每票等权,不对各子类别做加权处理,因此投票量较大的子类别(如 Website)对综合分数的影响更大。得分越高,代表模型在设计代码生成场景下的综合人类偏好越强。

常见问题 (FAQ)

01

什么是 Arcada Labs Code Categories Arena?

Arcada Labs Code Categories Arena 是专注于设计代码生成能力的匿名评测平台,覆盖 Website、UI 组件、游戏开发、数据可视化等多个代码生成子类别,并将投票汇总为综合榜单。

02

Arcada Code Arena 与 LMArena Coding Arena 有什么区别?

LMArena Coding Arena 主要评测通用编程能力,例如代码生成、调试和算法实现;Arcada Code Arena 专注于具有视觉呈现效果的前端设计代码,例如 HTML 页面、交互 UI、图表、SVG 和原型。

03

排名方法论是什么?

Arcada Labs 将各代码子类别的原始投票混合后运行 Bradley-Terry 模型。每票等权,不按子类别单独加权,因此投票量较大的子类别会对综合分数产生更大影响。

04

哪类模型在设计代码场景表现更好?

具备强视觉理解和前端代码生成能力的大模型通常表现更好。针对 UI 和代码生成优化的专项模型,在布局、交互和视觉细节任务上也可能有突出表现。