DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
Loading comparison...
页面目录
目录
  1. 首页
  2. 模型对比
  3. 对比结果

大模型评测对比结果

自动展示选中模型的核心信息与各评测得分,可左右滑动查看完整表格。 当前对比 4 个模型的评测数据与核心参数。

Kimi K2 0905Kimi K2DeepSeek-V3.1Qwen3-Coder-480B-A35B
规格对比
Moonshot AI

Kimi K2 0905

KI

Kimi K2-Instruct-0905

发布时间2025-09-05
上下文256K
参数量10000
常规模式(Non-Thinking Mode)
查看详情在线体验
Moonshot AI

Kimi K2

KI

Kimi-K2-0711-Preview

发布时间2025-07-11
上下文131K
参数量10000
常规模式(Non-Thinking Mode)
查看详情在线体验
DeepSeek-AI

DeepSeek-V3.1

DE

DeepSeek-V3.1

发布时间2025-08-20
上下文128K
参数量6710
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
查看详情在线体验
阿里巴巴

Qwen3-Coder-480B-A35B

QW

Qwen3-Coder-480B-A35B-Instruct

发布时间2025-07-23
上下文256K
参数量4800
常规模式(Non-Thinking Mode)
查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

性能评测对比

支持不同模式与工具的榜单对比。

全部模式 · 去除并行
展示视图
Thinking 模式(默认)
Thinking 模式(默认) - Help
  • Default: Thinking 模式(默认) (Standard/Medium)
  • All: Thinking 模式(全部)
全部工具
并行

Best Overall

Kimi K2 0905 · 52.65

Best Single

DeepSeek-V3.1 · AIME2025 88.40

Thinking 模式(默认)

Kimi K2 0905 · 1 全部模式

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

筛选: 全部模式 · 去除并行3 全部模式 · 4 评测基准
图表加载中...

评测得分表格

完整列出各模型/模式的评测得分,便于横向比较。

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

4 评测基准3 全部模式
支持模式:常规思考深思工具并行
评测基准
KI
Kimi K2 0905Moonshot AI
DE
DeepSeek-V3.1DeepSeek-AI
QW
Qwen3-Coder-480B-A35B阿里巴巴
综合评估
HLE
21.7015.90—
编程与软件工程
SWE-bench Verified
69.20—67.00
数学推理
AIME2025
75.2088.40—
AI Agent - 工具使用
Terminal-Bench
44.50—37.50

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格
KI
Kimi K2 0905Moonshot AI
KI
Kimi K2Moonshot AI
DE
DeepSeek-V3.1DeepSeek-AI
QW
Qwen3-Coder-480B-A35B阿里巴巴

模型信息卡片

开发机构
Moonshot AIMoonshot AIDeepSeek-AI阿里巴巴
模型全名
Kimi K2-Instruct-0905Kimi-K2-0711-PreviewDeepSeek-V3.1Qwen3-Coder-480B-A35B-Instruct
模型简介
未提供未提供未提供未提供
模型类型
聊天大模型聊天大模型聊天大模型编程大模型
模型代号
kimi-k2-0905kimi-k2-0711-base-previewdeepseek-v-3_1Qwen3-Coder-480B-A35B-Instruct
发布时间
2025-09-052025-07-112025-08-202025-07-23
MoE 架构
支持支持支持支持

规格与性能

上下文
256K131K128K256K
参数量
100001000067104800
激活参数量
320320370350
模型规模
100b100b100b100b
模型大小
1.01TB1.01TB1340GB470.77 GB
推理速度
推理等级
最大输出
4096134144819216384
支持模式
常规模式(Non-Thinking Mode)
常规模式(Non-Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
常规模式(Non-Thinking Mode)

开源与许可

代码开源
未开源未提供未开源未提供
权重开源
未开源未提供未开源未提供
商业授权
免费商用授权免费商用授权免费商用授权免费商用授权

模态支持

文本 输入/输出
/
/
/
/
图片 输入/输出
/
/
/
/
音频 输入/输出
/
/
/
/
视频 输入/输出
/
/
/
/
Embedding 输入/输出
/
/
/
/

API 接口详情

文本 价格
输入: 0.60 美元/ 100 万tokens输出: 2.5 美元/ 100 万tokens
输入: 0.6 美元/100 万tokens输出: 2.5 美元/100 万tokens
输入: 0.56 美元/100 万tokens输出: 1.68 美元/100 万tokens
未提供
图片 API 价格
未提供未提供未提供未提供
音频 API 价格
未提供未提供未提供未提供
视频 API 价格
未提供未提供未提供未提供
Embedding API 价格
未提供未提供未提供未提供

资源与链接

GitHub
未提供仓库未提供仓库
Hugging Face
模型页模型页模型页模型页
官方页面
未提供未提供未提供未提供
实用指南
未提供未提供未提供未提供
论文/报告
Kimi K2: Open Agentic IntelligenceDeepSeek-V3.1 ReleaseQwen3-Coder: Agentic Coding in the World
DataLearnerAI
Moonshot AI发布Kimi K2-Instruct-0905:256K上下文长度加持,全面升级的开放式智能体模型Kimi开源K2大模型:全球首个开源可商用的1万亿参数规模大模型,MoE架构,评测结果与DeepSeekV3相当,但模型文件有1TB!DeepSeek V4没有等到,但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了,小幅更新,但核心架构和参数不变阿里开源全新编程大模型Qwen3-Coder-480B-A35B,官方宣称其编程水平接近Claude Sonnet 4,免费开源可商用,同时开源Claude Code免费平替选择Qwen Code

API 价格

API 价格对比

输入输出 token 价格并排展示

模型数据收集自官网、Artificial Analysis等页面