DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型 OpenClaw 能力评测排行榜

本页面提供大模型 OpenClaw 能力评测排行榜,包含 Claw Bench 与 Pinch Bench 两项子评测,从不同维度综合衡量大模型的智能体综合能力,对 GPT、Claude、Qwen、DeepSeek 等主流模型进行深度对比。

数据更新于 2026-04-19 11:50:43

截至 2026年4月,本页覆盖 Claw Bench, Pinch Bench 等评测基准,聚焦 大模型 OpenClaw 能力评测排行榜 方向的模型对比。

点击模型名称可进入详情页查看上下文长度、许可方式与 API 价格。数据口径说明见 数据方法论。

基准评测
Claw BenchPinch Bench
更多评测
参数规模:全部3B及以下7B13B34B65B100B及以上
模型类型:全部推理大模型

大模型性能评测结果

数据来源:DataLearnerAI
排名模型参数(亿)开源情况
1
MiniMax M2.5
92.1087.802290B免费商用
2
MiniMax-M2.7
91.7087.102290B不可商用
3
GLM-5
91.7086.407440B免费商用
4
GLM-4.5-Air
—85.701060B免费商用
5
Qwen3.5-122B-A10B
86.0085.501220B免费商用
6
Step 3.5 Flash
84.9085.301960B免费商用
7
Kimi K2.5
81.7084.8010000B免费商用
8
DeepSeek V3.2
79.0084.306710B免费商用
9
M2.1
—84.302300B免费商用
10
Qwen3-Max-Thinking
—80.3010000B不开源
11
Mistral Large 3
78.6072.206750B免费商用
12
Gemini 2.5 Flash
—70.70—不开源
13
Llama 4 Maverick
—46.104000B免费商用
14
Kimi K2 Thinking
82.50—10400B免费商用
15
ERNIE 5.0 Thinking Preview
51.00—24000B不开源
1
MiniMax M2.5
2290B
Claw Bench92.10
Pinch Bench87.80
免费商用
2
MiniMax-M2.7
2290B
Claw Bench91.70
Pinch Bench87.10
不可商用
3
GLM-5
7440B
Claw Bench91.70
Pinch Bench86.40
免费商用
4
GLM-4.5-Air
1060B
Claw Bench—
Pinch Bench85.70
免费商用
5
Qwen3.5-122B-A10B
1220B
Claw Bench86.00
Pinch Bench85.50
免费商用
6
Step 3.5 Flash
1960B
Claw Bench84.90
Pinch Bench85.30
免费商用
7
Kimi K2.5
10000B
Claw Bench81.70
Pinch Bench84.80
免费商用
8
DeepSeek V3.2
6710B
Claw Bench79.00
Pinch Bench84.30
免费商用
9
M2.1
2300B
Claw Bench—
Pinch Bench84.30
免费商用
10
Qwen3-Max-Thinking
10000B
Claw Bench—
Pinch Bench80.30
不开源
11
Mistral Large 3
6750B
Claw Bench78.60
Pinch Bench72.20
免费商用
12
Gemini 2.5 Flash
Claw Bench—
Pinch Bench70.70
不开源
13
Llama 4 Maverick
4000B
Claw Bench—
Pinch Bench46.10
免费商用
14
Kimi K2 Thinking
10400B
Claw Bench82.50
Pinch Bench—
免费商用
15
ERNIE 5.0 Thinking Preview
24000B
Claw Bench51.00
Pinch Bench—
不开源
排序:
基座大模型
指令优化/聊天优化大模型
编程大模型
开源:全部开源闭源
模型发布时间截止: