大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/code

筛选条件

大模型排名数据表格

排名
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1 Anthropic Logo
Claude Sonnet 4.5
parallel_thinking + 使用工具
82.00 未公布 未公布 未知 不开源
2 Anthropic Logo
Claude Sonnet 4
parallel_thinking + 使用工具
80.20 未公布 未公布 未知 不开源
3 Anthropic Logo
Claude Opus 4.1
parallel_thinking + 使用工具
79.40 未公布 未公布 未知 不开源
4 Anthropic Logo
Claude Sonnet 4.5
thinking + 使用工具
77.20 未公布 未公布 未知 不开源
5 OpenAI Logo
GPT-5.1-Codex-Max
high + 使用工具
76.80 未公布 未公布 未知 不开源
6 OpenAI Logo 76.30 未公布 未公布 未知 不开源
7 Google Deep Mind Logo 76.20 未公布 未公布 未知 不开源
8 OpenAI Logo
o3-pro
high
75.00 未公布 未公布 未知 不开源
9 Anthropic Logo
Claude Opus 4.1
thinking + 使用工具
74.50 未公布 未公布 未知 不开源
10 Anthropic Logo
Claude Opus 4.1
thinking
74.50 未公布 未公布 未知 不开源
11 OpenAI Logo 74.50 未公布 未公布 未知 不开源
12 xAI Logo
Grok 4 Heavy
parallel_thinking + 使用工具
73.50 未公布 未公布 未知 不开源
13 Anthropic Logo
Haiku 4.5
thinking + 使用工具
73.30 未公布 未公布 未知 不开源
14 OpenAI Logo
GPT-5
high
72.80 未公布 未公布 未知 不开源
15 Anthropic Logo
Claude Sonnet 4
thinking + 使用工具
72.70 未公布 未公布 未知 不开源
16 Anthropic Logo 72.50 56.60 未公布 未知 不开源
17 xAI Logo 72.00 未公布 未公布 未知 不开源
18 Moonshot AI Logo
Kimi K2 Thinking
thinking + 使用工具
71.30 未公布 未公布 10,400 免费商用授权
19 xAI Logo
Grok Code Fast 1
thinking
70.80 未公布 未公布 未知 不开源
20 OpenAI Logo
GPT-5.1 Codex
high + 使用工具
70.40 85.50 未公布 未知 不开源
21 Anthropic Logo 70.30 未公布 未公布 未知 不开源
22 阿里巴巴 Logo 69.60 57.50 未公布 未知 不开源
23 MiniMaxAI Logo
MiniMax M2
thinking + 使用工具
69.40 未公布 未公布 2,300 免费商用授权
24 Moonshot AI Logo
Kimi K2 0905
thinking + 使用工具
69.20 未公布 未公布 10,000 免费商用授权
25 Moonshot AI Logo 69.20 未公布 未公布 10,000 免费商用授权
26 OpenAI Logo
OpenAI o3
thinking
69.10 未公布 未公布 未知 不开源
27 DeepSeek-AI Logo 68.40 74.90 未公布 6,710 免费商用授权
28 OpenAI Logo
OpenAI o4 - mini
thinking
68.10 未公布 未公布 未知 不开源
29 智谱AI Logo
GLM-4.6
thinking + 使用工具
68.00 84.50 未公布 3,550 免费商用授权
30 智谱AI Logo 68.00 56.00 未公布 3,550 免费商用授权
31 DeepSeek-AI Logo
DeepSeek V3.2-Exp
thinking + 使用工具
67.80 未公布 未公布 6,710 免费商用授权
32 Google Deep Mind Logo
Gemini 2.5-Pro
thinking
67.20 未公布 未公布 未知 不开源
33 阿里巴巴 Logo 67.00 未公布 未公布 4,800 免费商用授权
34 DeepSeek-AI Logo 66.00 56.40 未公布 6,710 免费商用授权
35 Anthropic Logo 64.80 59.00 未公布 未知 不开源
36 智谱AI Logo
GLM-4.5
thinking
64.20 72.90 未公布 3,550 免费商用授权
37 Google Deep Mind Logo 63.80 70.40 未公布 未知 不开源
38 Google Deep Mind Logo 63.20 77.10 未公布 未知 不开源
39 MistralAI Logo 61.60 未公布 未公布 未知 不开源
40 Anthropic Logo 60.60 51.00 未公布 未知 不开源
41 OpenAI Logo
GPT OSS 120B
thinking
60.10 未公布 未公布 117 免费商用授权
42 xAI Logo
Grok 4
thinking
58.60 82.00 未公布 未知 不开源
43 智谱AI Logo
GLM-4.5-Air
thinking
57.60 70.70 未公布 1,060 免费商用授权
44 DeepSeek-AI Logo
DeepSeek-R1-0528
thinking
57.60 73.30 未公布 6,710 免费商用授权
45 MiniMaxAI Logo 56.00 65.00 未公布 4,560 免费商用授权
46 MiniMaxAI Logo 55.60 62.30 未公布 4,560 免费商用授权
47 OpenAI Logo 54.60 40.50 未公布 未知 不开源
48 Google Deep Mind Logo 54.00 未公布 未公布 未知 不开源
49 MistralAI Logo 53.60 未公布 未公布 240 免费商用授权
50 Moonshot AI Logo 51.80 53.70 未公布 10,000 免费商用授权
51 阿里巴巴 Logo 51.60 未公布 未公布 305 免费商用授权
52 Google Deep Mind Logo 50.00 41.10 未公布 未知 不开源
53 OpenAI Logo 49.30 69.50 97.60 未知 不开源
54 DeepSeek-AI Logo 49.20 65.90 未公布 6,710 免费商用授权
55 Anthropic Logo 49.00 38.70 93.70 未知 不开源
56 OpenAI Logo 48.90 71.00 未公布 未知 不开源
57 Google Deep Mind Logo
Gemini 2.5 Flash
thinking
48.90 55.40 未公布 未知 不开源
58 MistralAI Logo 46.80 未公布 未公布 240 免费商用授权
59 OpenAI Logo
OpenAI o3-mini
thinking
40.80 未公布 未公布 未知 不开源
60 DeepSeek-AI Logo 38.80 49.20 未公布 6,710 免费商用授权
61 OpenAI Logo 38.00 46.40 未公布 未知 不开源
62 阿里巴巴 Logo 34.40 70.70 未公布 2,350 免费商用授权
63 OpenAI Logo 31.00 35.10 90.00 未知 不开源
64 Google Deep Mind Logo 27.60 34.30 未公布 未知 不开源
65 OpenAI Logo 23.60 未公布 未公布 未知 不开源
66 DeepMind Logo 21.40 29.10 未公布 未知 不开源
67 阿里巴巴 Logo 未公布 74.10 未公布 305 免费商用授权
68 阿里巴巴 Logo 未公布 35.10 未公布 40 免费商用授权
69 OpenAI Logo 未公布 75.80 未公布 未知 不开源
70 Google Deep Mind Logo 未公布 77.10 未公布 未知 不开源
71 阿里巴巴 Logo 未公布 55.20 未公布 40 免费商用授权
72 百度 Logo 未公布 38.80 未公布 4,240 免费商用授权
73 OpenAI Logo 未公布 35.80 未公布 未知 不开源
74 DeepSeek-AI Logo
DeepSeek-V3.1
thinking
未公布 74.80 未公布 6,710 免费商用授权
75 阿里巴巴 Logo 未公布 56.60 未公布 800 免费商用授权
76 xAI Logo
Grok 4 Fast
thinking
未公布 80.00 未公布 未知 不开源
77 OpenAI Logo
GPT-5-mini
thinking
未公布 55.00 未公布 未知 不开源
78 Anthropic Logo 未公布 48.50 未公布 未知 不开源
79 Anthropic Logo
Haiku 4.5
thinking
未公布 62.00 未公布 未知 不开源
80 Anthropic Logo 未公布 71.00 未公布 未知 不开源
81 DeepSeek-AI Logo 未公布 80.00 未公布 6,710 免费商用授权
82 DeepSeek-AI Logo 未公布 55.00 未公布 6,710 免费商用授权
83 Moonshot AI Logo
Kimi K2 Thinking
thinking
未公布 83.10 未公布 10,400 免费商用授权
84 DeepSeek-AI Logo 未公布 74.10 未公布 6,710 免费商用授权
85 智谱AI Logo
GLM-4.6
thinking
未公布 82.80 未公布 3,550 免费商用授权
86 MiniMaxAI Logo
MiniMax M2
thinking
未公布 83.00 未公布 2,300 免费商用授权
87 Anthropic Logo
Claude Sonnet 4
thinking
未公布 66.00 未公布 未知 不开源
88 xAI Logo
Grok 4.1 Fast
thinking
未公布 82.00 未公布 未知 不开源
89 Facebook AI研究实验室 Logo 未公布 未公布 66.50 80 免费商用授权
90 腾讯AI实验室 Logo 未公布 64.90 未公布 未知 不开源
91 CohereAI Logo 未公布 未公布 62.20 320 不可以商用
92 Anthropic Logo 未公布 未公布 88.10 未知 不开源
93 OpenAI Logo 未公布 未公布 87.20 未知 不开源
94 MistralAI Logo 未公布 未公布 88.41 240 免费商用授权
95 Google Deep Mind Logo 未公布 24.60 未公布 120 免费商用授权
96 阿里巴巴 Logo 未公布 未公布 19.00 325 免费商用授权
97 Facebook AI研究实验室 Logo 未公布 30.20 89.00 4,050 免费商用授权
98 腾讯AI实验室 Logo 未公布 32.00 91.00 未知 不开源
99 OpenAI Logo 未公布 52.00 92.40 未知 不开源
100 阿里巴巴 Logo 未公布 65.60 未公布 未知 免费商用授权
101 Moonshot AI Logo 未公布 65.90 未公布 未知 不开源
102 Moonshot AI Logo 未公布 73.80 未公布 未知 不开源
103 OpenAI Logo 未公布 67.40 未公布 未知 不开源
104 阿里巴巴 Logo 未公布 未公布 73.20 未知 不开源
105 xAI Logo 未公布 79.40 未公布 未知 不开源
106 阿里巴巴 Logo 未公布 未公布 42.10 30 免费商用授权
107 Facebook AI研究实验室 Logo 未公布 未公布 28.00 32 免费商用授权
108 Microsoft Logo 未公布 未公布 74.40 38 免费商用授权
109 MistralAI Logo 未公布 未公布 29.30 70 免费商用授权
110 Google Research Logo 未公布 未公布 37.80 90 免费商用授权
111 Facebook AI研究实验室 Logo 未公布 未公布 33.50 80 免费商用授权
112 阿里巴巴 Logo 未公布 未公布 57.90 70 免费商用授权
113 Moonshot AI Logo 未公布 未公布 48.10 160 免费商用授权
114 xAI Logo 未公布 未公布 74.10 未知 不开源
115 xAI Logo 未公布 未公布 88.40 2,690 免费商用授权
116 Anthropic Logo 未公布 未公布 84.90 未知 不开源
117 Google Deep Mind Logo 未公布 未公布 89.00 未知 不开源
118 亚马逊 Logo 未公布 未公布 89.00 未知 不开源
119 阿里巴巴 Logo 未公布 未公布 59.10 727 免费商用授权
120 OpenAI Logo 未公布 未公布 90.20 未知 不开源
121 智谱AI Logo 未公布 51.80 未公布 90 免费商用授权
122 DeepSeek-AI Logo 未公布 34.60 89.00 6,810 免费商用授权
123 阿里巴巴 Logo 未公布 61.80 未公布 80 免费商用授权
124 阿里巴巴 Logo
Qwen3-8B
thinking
未公布 57.50 未公布 80 免费商用授权
125 Tencent ARC Logo 未公布 57.00 未公布 70 免费商用授权
126 Google Deep Mind Logo
Gemini 2.5 Deep Think
deeper_thinking
未公布 87.60 未公布 未知 不开源
127 StepFunAI Logo 未公布 67.10 未公布 3,210 免费商用授权
128 Anthropic Logo 未公布 未公布 92.00 未知 不开源
129 阿里巴巴 Logo 未公布 29.00 未公布 305 免费商用授权
130 阿里巴巴 Logo 未公布 43.20 未公布 305 免费商用授权
131 阿里巴巴 Logo 未公布 74.10 未公布 2,350 免费商用授权
132 阿里巴巴 Logo 未公布 51.80 未公布 2,350 免费商用授权
133 MistralAI Logo 未公布 31.50 81.10 220 不可以商用
134 MistralAI Logo 未公布 37.90 86.60 未知 不开源
135 Google Deep Mind Logo 未公布 29.70 87.80 270 免费商用授权
136 阿里巴巴 Logo 未公布 65.70 未公布 320 免费商用授权
137 阿里巴巴 Logo
Qwen3-235B-A22B
thinking
未公布 70.70 未公布 2,350 免费商用授权
138 华为 Logo 未公布 67.10 未公布 70 免费商用授权
139 华为 Logo 未公布 59.60 未公布 719 免费商用授权
140 百度 Logo 未公布 38.80 未公布 3,000 免费商用授权
141 腾讯AI实验室 Logo 未公布 63.90 未公布 800 免费商用授权
142 DeepMind Logo 未公布 28.90 未公布 未知 不开源
143 Google Deep Mind Logo 未公布 80.40 未公布 未知 不开源
144 MistralAI Logo 未公布 59.36 未公布 未知 不开源
145 MistralAI Logo 未公布 55.84 未公布 240 免费商用授权
146 xAI Logo 未公布 70.60 未公布 未知 不开源
147 阿里巴巴 Logo 未公布 51.20 88.40 320 免费商用授权
148 Facebook AI研究实验室 Logo 未公布 49.40 未公布 20,000 免费商用授权
149 Facebook AI研究实验室 Logo 未公布 33.30 80.50 700 免费商用授权
150 Facebook AI研究实验室 Logo 未公布 33.30 88.40 700 免费商用授权
151 Facebook AI研究实验室 Logo 未公布 43.40 未公布 4,000 免费商用授权
152 Facebook AI研究实验室 Logo 未公布 32.80 未公布 1,090 免费商用授权
SWE-bench Verified (编程与软件工程) 82.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 80.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 79.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 77.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 76.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 75.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 74.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.50
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 73.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.70
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.50
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 72.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 71.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 70.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.40
LiveCodeBench (编程与软件工程) 85.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 70.30
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.60
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 69.40
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 69.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.40
LiveCodeBench (编程与软件工程) 74.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 84.50
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 68.00
LiveCodeBench (编程与软件工程) 56.00
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 67.20
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 67.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 4,800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 66.00
LiveCodeBench (编程与软件工程) 56.40
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 64.80
LiveCodeBench (编程与软件工程) 59.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 64.20
LiveCodeBench (编程与软件工程) 72.90
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 63.80
LiveCodeBench (编程与软件工程) 70.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 63.20
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 61.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.60
LiveCodeBench (编程与软件工程) 51.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 60.10
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 58.60
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 57.60
LiveCodeBench (编程与软件工程) 73.30
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 56.00
LiveCodeBench (编程与软件工程) 65.00
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 55.60
LiveCodeBench (编程与软件工程) 62.30
HumanEval (编程与软件工程) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 54.60
LiveCodeBench (编程与软件工程) 40.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 54.00
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 53.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.80
LiveCodeBench (编程与软件工程) 53.70
HumanEval (编程与软件工程) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 51.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 50.00
LiveCodeBench (编程与软件工程) 41.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.30
LiveCodeBench (编程与软件工程) 69.50
HumanEval (编程与软件工程) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 49.20
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 49.00
LiveCodeBench (编程与软件工程) 38.70
HumanEval (编程与软件工程) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 48.90
LiveCodeBench (编程与软件工程) 55.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 46.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 40.80
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 38.80
LiveCodeBench (编程与软件工程) 49.20
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 38.00
LiveCodeBench (编程与软件工程) 46.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 34.40
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 31.00
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 27.60
LiveCodeBench (编程与软件工程) 34.30
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 23.60
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 21.40
LiveCodeBench (编程与软件工程) 29.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.10
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 75.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 77.10
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.20
HumanEval (编程与软件工程) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 35.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.80
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 56.60
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 48.50
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 62.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 71.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.00
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.10
HumanEval (编程与软件工程) 未公布
参数(亿) 10,400
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 83.00
HumanEval (编程与软件工程) 未公布
参数(亿) 2,300
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 66.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 82.00
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 64.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 24.60
HumanEval (编程与软件工程) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 30.20
HumanEval (编程与软件工程) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.00
HumanEval (编程与软件工程) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 52.00
HumanEval (编程与软件工程) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 73.80
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 79.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 88.40
参数(亿) 2,690
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 34.60
HumanEval (编程与软件工程) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 61.80
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.50
HumanEval (编程与软件工程) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 57.00
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 87.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 未公布
HumanEval (编程与软件工程) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.00
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.20
HumanEval (编程与软件工程) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 74.10
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.80
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 31.50
HumanEval (编程与软件工程) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 37.90
HumanEval (编程与软件工程) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 29.70
HumanEval (编程与软件工程) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 65.70
HumanEval (编程与软件工程) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.70
HumanEval (编程与软件工程) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 67.10
HumanEval (编程与软件工程) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.60
HumanEval (编程与软件工程) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 38.80
HumanEval (编程与软件工程) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 63.90
HumanEval (编程与软件工程) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 28.90
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 80.40
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 59.36
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 55.84
HumanEval (编程与软件工程) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 70.60
HumanEval (编程与软件工程) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 51.20
HumanEval (编程与软件工程) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 49.40
HumanEval (编程与软件工程) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 33.30
HumanEval (编程与软件工程) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 43.40
HumanEval (编程与软件工程) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
SWE-bench Verified (编程与软件工程) 未公布
LiveCodeBench (编程与软件工程) 32.80
HumanEval (编程与软件工程) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情