页面加载中,请稍候…
Kimi K2-Instruct-0905
Kimi-K2-0711-Preview
DeepSeek-V3.1
Qwen3-Coder-480B-A35B-Instruct
支持不同模式与工具的榜单对比。
模式筛选
选择思考模式 / 工具使用 / 是否去除并行,更新下方柱状对比。
模型数据收集自官网、Artificial Analysis等页面
完整列出各模型/模式的评测得分,便于横向比较。
评测得分表格
直观查看各模型/模式在每个评测基准上的得分。
| 评测基准 | KI Kimi K2 0905Moonshot AI | KI Kimi K2Moonshot AI | DE DeepSeek-V3.1DeepSeek-AI | QW Qwen3-Coder-480B-A35B阿里巴巴 | GL GLM-4.5智谱AI | ||
|---|---|---|---|---|---|---|---|
| 编程与软件工程 | |||||||
SWE-bench Verified | 69.20 | 69.20 | 51.80 | 66.00 | — | 67.00 | 64.20 |
| AI Agent - 工具使用 | |||||||
Terminal-Bench | 44.50 | 44.50 | 37.50 | — | 31.30 | 37.50 | 37.50 |
其他能力
是否 MoE、商业授权、模态支持等附加能力对比。
| 功能与规格 | KI Kimi K2 0905Moonshot AI | KI Kimi K2Moonshot AI | DE DeepSeek-V3.1DeepSeek-AI | QW Qwen3-Coder-480B-A35B阿里巴巴 | GL GLM-4.5智谱AI |
|---|---|---|---|---|---|
模型信息卡片 | |||||
开发机构 | Moonshot AI | Moonshot AI | DeepSeek-AI | 阿里巴巴 | 智谱AI |
模型全名 | Kimi K2-Instruct-0905 | Kimi-K2-0711-Preview | DeepSeek-V3.1 | Qwen3-Coder-480B-A35B-Instruct | GLM-4.5-MoE-355B-A32B-0715 |
模型简介 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
模型类型 | 聊天大模型 | 聊天大模型 | 聊天大模型 | 编程大模型 | 推理大模型 |
模型代号 | kimi-k2-0905 | kimi-k2-0711-base-preview | deepseek-v-3_1 | Qwen3-Coder-480B-A35B-Instruct | glm-4_5_moe-355b-a32b-0715 |
发布时间 | 2025-09-05 | 2025-07-11 | 2025-08-20 | 2025-07-23 | 2025-07-28 |
MoE 架构 | 支持 | 支持 | 支持 | 支持 | 支持 |
规格与性能 | |||||
上下文 | 256K | 131K | 128K | 256K | 128K |
参数量 | 10000 | 10000 | 6710 | 4800 | 3550 |
激活参数量 | 320 | 320 | 370 | 350 | 320 |
模型规模 | 100b | 100b | 100b | 100b | 100b |
模型大小 | 1.01TB | 1.01TB | 1340GB | 470.77 GB | 710 GB |
推理速度 | |||||
推理等级 | |||||
最大输出 | 4096 | 134144 | 8192 | 16384 | 97280 |
支持模式 | 常规模式(Non-Thinking Mode) | 常规模式(Non-Thinking Mode) | 常规模式(Non-Thinking Mode)思考模式(Thinking Mode) | 常规模式(Non-Thinking Mode) | 常规模式(Non-Thinking Mode)思考模式(Thinking Mode) |
开源与许可 | |||||
代码开源 | 未开源 | 未提供 | 未开源 | 未提供 | 未提供 |
权重开源 | 未开源 | 未提供 | 未开源 | 未提供 | 未提供 |
商业授权 | 免费商用授权 | 免费商用授权 | 免费商用授权 | 免费商用授权 | 免费商用授权 |
模态支持 | |||||
文本 输入/输出 | / | / | / | / | / |
图片 输入/输出 | / | / | / | / | / |
音频 输入/输出 | / | / | / | / | / |
视频 输入/输出 | / | / | / | / | / |
Embedding 输入/输出 | / | / | / | / | / |
API 接口详情 | |||||
文本 价格 | 输入:0.60 美元/ 100 万tokens输出:2.5 美元/ 100 万tokens | 输入:0.6 美元/100 万tokens输出:2.5 美元/100 万tokens | 输入:0.56 美元/100 万tokens输出:1.68 美元/100 万tokens | 未提供 | 输入:0.6 美元/100 万tokens输出:2.2 美元/100 万tokens |
图片 价格 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
音频 价格 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
视频 价格 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
Embedding 价格 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
资源与链接 | |||||
GitHub | 未提供 | 仓库 | 未提供 | 仓库 | 仓库 |
Hugging Face | 模型页 | 模型页 | 模型页 | 模型页 | 模型页 |
官方页面 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
实用指南 | 未提供 | 未提供 | 未提供 | 未提供 | 未提供 |
论文/报告 | Kimi K2: Open Agentic Intelligence | DeepSeek-V3.1 Release | Qwen3-Coder: Agentic Coding in the World | GLM-4.5: Reasoning, Coding, and Agentic Abililties | |
DataLearnerAI 博客 | Moonshot AI发布Kimi K2-Instruct-0905:256K上下文长度加持,全面升级的开放式智能体模型 | Kimi开源K2大模型:全球首个开源可商用的1万亿参数规模大模型,MoE架构,评测结果与DeepSeekV3相当,但模型文件有1TB! | DeepSeek V4没有等到,但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了,小幅更新,但核心架构和参数不变 | 阿里开源全新编程大模型Qwen3-Coder-480B-A35B,官方宣称其编程水平接近Claude Sonnet 4,免费开源可商用,同时开源Claude Code免费平替选择Qwen Code | Zhipu AI重磅发布GLM-4.5系列:技术深度解析与多维度性能评测 |
API 价格
输入输出 token 价格并排展示
输入输出 token 价格并排展示