DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型 OpenClaw 能力评测排行榜

本页面提供大模型 OpenClaw 能力评测排行榜,包含 Claw Bench 与 Pinch Bench 两项子评测,从不同维度综合衡量大模型的智能体综合能力,对 GPT、Claude、Qwen、DeepSeek 等主流模型进行深度对比。

数据更新于 2026-04-19 11:50:43

截至 2026年4月,本页覆盖 Claw Bench, Pinch Bench 等评测基准,聚焦 大模型 OpenClaw 能力评测排行榜 方向的模型对比。

点击模型名称可进入详情页查看上下文长度、许可方式与 API 价格。数据口径说明见 数据方法论。

基准评测
Claw BenchPinch Bench
更多评测
参数规模:全部3B及以下7B13B34B65B100B及以上
模型类型:全部推理大模型基座大模型指令优化/聊天优化大模型编程大模型
开源:全部开源闭源
模型发布时间截止:

大模型性能评测结果

数据来源:DataLearnerAI
排名模型参数(亿)开源情况
1
GPT-5.4
开启思考工具
92.7090.50—不开源
2
Qwen3.5-27B
开启思考工具
75.2090.00270B免费商用
3
Qwen3.5-397B-A17B
开启思考工具
—89.10397B免费商用
4
Claude Sonnet 4.5
开启思考工具
88.1088.20—不开源
5
Claude Sonnet 4.6
开启思考工具
—88.00—不开源
6
MiniMax M2.5
开启思考工具
92.1087.802290B免费商用
7
Claude Opus 4.6
开启思考工具
—87.40—不开源
8
Opus 4.5
扩展思考工具
91.5087.20—不开源
9
MiniMax-M2.7
开启思考工具
91.7087.102290B不可商用
10
Gemini 3.1 Pro Preview
开启思考工具
—86.70—不开源
11
GLM-5-Turbo
开启思考工具
93.8086.50—不开源
12
GLM-5
开启思考工具
91.7086.407440B免费商用
13
GLM-4.5-Air
开启思考工具
—85.701060B免费商用
14
Qwen3.5-122B-A10B
开启思考工具
86.0085.501220B免费商用
15
Step 3.5 Flash
开启思考工具
84.9085.301960B免费商用
16
Gemini 3.0 Flash
开启思考工具
85.7085.20—不开源
17
Kimi K2.5
开启思考工具
81.7084.8010000B免费商用
18
DeepSeek V3.2
开启思考工具
79.0084.306710B免费商用
19
M2.1
开启思考工具
—84.302300B免费商用
20
Grok 4.1 Fast
开启思考工具
88.6082.40—不开源
21
Haiku 4.5
开启思考工具
89.4082.00—不开源
22
Claude Sonnet 4
开启思考工具
77.8080.50—不开源
23
GPT-5-mini
开启思考工具
—80.30—不开源
24
Qwen3-Max-Thinking
开启思考工具
—80.3010000B不开源
25
Qwen3-Coder-Next
开启思考工具
75.8079.1080B免费商用
26
Qwen3.5-35B-A3B
开启思考工具
91.4078.40350B免费商用
27
GPT-4o mini
开启思考工具
—75.00—不开源
28
Mistral Large 3
开启思考工具
78.6072.206750B免费商用
29
Gemini 2.5 Pro Experimental 03-25
开启思考工具
80.4071.90—不开源
30
GPT-4o
开启思考工具
—71.10—不开源
1
GPT-5.4
开启思考工具
Claw Bench92.70
Pinch Bench90.50
不开源
2
Qwen3.5-27B
开启思考工具
270B
Claw Bench75.20
Pinch Bench90.00
免费商用
3
Qwen3.5-397B-A17B
开启思考工具
397B
Claw Bench—
Pinch Bench89.10
免费商用
4
Claude Sonnet 4.5
开启思考工具
Claw Bench88.10
Pinch Bench88.20
不开源
5
Claude Sonnet 4.6
开启思考工具
Claw Bench—
Pinch Bench88.00
不开源
6
MiniMax M2.5
开启思考工具
2290B
Claw Bench92.10
Pinch Bench87.80
免费商用
7
Claude Opus 4.6
开启思考工具
Claw Bench—
Pinch Bench87.40
不开源
8
Opus 4.5
扩展思考工具
Claw Bench91.50
Pinch Bench87.20
不开源
9
MiniMax-M2.7
开启思考工具
2290B
Claw Bench91.70
Pinch Bench87.10
不可商用
10
Gemini 3.1 Pro Preview
开启思考工具
Claw Bench—
Pinch Bench86.70
不开源
11
GLM-5-Turbo
开启思考工具
Claw Bench93.80
Pinch Bench86.50
不开源
12
GLM-5
开启思考工具
7440B
Claw Bench91.70
Pinch Bench86.40
免费商用
13
GLM-4.5-Air
开启思考工具
1060B
Claw Bench—
Pinch Bench85.70
免费商用
14
Qwen3.5-122B-A10B
开启思考工具
1220B
Claw Bench86.00
Pinch Bench85.50
免费商用
15
Step 3.5 Flash
开启思考工具
1960B
Claw Bench84.90
Pinch Bench85.30
免费商用
16
Gemini 3.0 Flash
开启思考工具
Claw Bench85.70
Pinch Bench85.20
不开源
17
Kimi K2.5
开启思考工具
10000B
Claw Bench81.70
Pinch Bench84.80
免费商用
18
DeepSeek V3.2
开启思考工具
6710B
Claw Bench79.00
Pinch Bench84.30
免费商用
19
M2.1
开启思考工具
2300B
Claw Bench—
Pinch Bench84.30
免费商用
20
Grok 4.1 Fast
开启思考工具
Claw Bench88.60
Pinch Bench82.40
不开源
21
Haiku 4.5
开启思考工具
Claw Bench89.40
Pinch Bench82.00
不开源
22
Claude Sonnet 4
开启思考工具
Claw Bench77.80
Pinch Bench80.50
不开源
23
GPT-5-mini
开启思考工具
Claw Bench—
Pinch Bench80.30
不开源
24
Qwen3-Max-Thinking
开启思考工具
10000B
Claw Bench—
Pinch Bench80.30
不开源
25
Qwen3-Coder-Next
开启思考工具
80B
Claw Bench75.80
Pinch Bench79.10
免费商用
26
Qwen3.5-35B-A3B
开启思考工具
350B
Claw Bench91.40
Pinch Bench78.40
免费商用
27
GPT-4o mini
开启思考工具
Claw Bench—
Pinch Bench75.00
不开源
28
Mistral Large 3
开启思考工具
6750B
Claw Bench78.60
Pinch Bench72.20
免费商用
29
Gemini 2.5 Pro Experimental 03-25
开启思考工具
Claw Bench80.40
Pinch Bench71.90
不开源
30
GPT-4o
开启思考工具
Claw Bench—
Pinch Bench71.10
不开源
排序:
查看全部 44 个模型的 Pinch Bench 完整排名