加载中...

Kimi K2 0905、Kimi K2、DeepSeek-V3.1等 4 款对比结果 - 参数、价格与评测分数 | DataLearnerAI

大模型评测对比结果

自动展示选中模型的核心信息与各评测得分，可左右滑动查看完整表格。当前对比 4 个模型的评测数据与核心参数。

Kimi K2 0905Kimi K2DeepSeek-V3.1Qwen3-Coder-480B-A35B

规格对比

Moonshot AI

Kimi K2 0905

Kimi K2-Instruct-0905

发布时间2025-09-05

上下文256K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

Moonshot AI

Kimi K2

Kimi-K2-0711-Preview

发布时间2025-07-11

上下文131K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

DeepSeek-AI

DeepSeek-V3.1

发布时间2025-08-20

上下文128K

参数量6710

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

阿里巴巴

Qwen3-Coder-480B-A35B

Qwen3-Coder-480B-A35B-Instruct

发布时间2025-07-23

上下文256K

参数量4800

常规模式（Non-Thinking Mode）

查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

性能评测对比

支持不同模式与工具的榜单对比。

全部模式 · 去除并行

展示视图

Thinking 模式（默认）

Thinking 模式（默认） - Help

Default: Thinking 模式（默认） (Standard/Medium)
All: Thinking 模式（全部）

全部工具

并行

Best Overall

Kimi K2 0905 · 52.65

Best Single

DeepSeek-V3.1 · AIME2025 88.40

Thinking 模式（默认）

Kimi K2 0905 · 1 全部模式

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

筛选: 全部模式 · 去除并行3 全部模式 · 4 评测基准

图表加载中...

评测得分表格

完整列出各模型/模式的评测得分，便于横向比较。

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

4 评测基准3 全部模式

支持模式:常规思考深思工具并行

评测基准	KI Kimi K2 0905Moonshot AI	DE DeepSeek-V3.1DeepSeek-AI	QW Qwen3-Coder-480B-A35B阿里巴巴
评测基准
综合评估
HLE	21.70	15.90	—
编程与软件工程
SWE-bench Verified	69.20	—	67.00
数学推理
AIME2025	75.20	88.40	—
AI Agent - 工具使用
Terminal-Bench	44.50	—	37.50

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格	KI Kimi K2 0905Moonshot AI	KI Kimi K2Moonshot AI	DE DeepSeek-V3.1DeepSeek-AI	QW Qwen3-Coder-480B-A35B阿里巴巴
模型信息卡片
开发机构	Moonshot AI	Moonshot AI	DeepSeek-AI	阿里巴巴
模型全名	Kimi K2-Instruct-0905	Kimi-K2-0711-Preview	DeepSeek-V3.1	Qwen3-Coder-480B-A35B-Instruct
模型简介	未提供	未提供	未提供	未提供
模型类型	聊天大模型	聊天大模型	聊天大模型	编程大模型
模型代号	kimi-k2-0905	kimi-k2-0711-base-preview	deepseek-v-3_1	Qwen3-Coder-480B-A35B-Instruct
发布时间	2025-09-05	2025-07-11	2025-08-20	2025-07-23
MoE 架构	支持	支持	支持	支持
规格与性能
上下文	256K	131K	128K	256K
参数量	10000	10000	6710	4800
激活参数量	320	320	370	350
模型规模	100b	100b	100b	100b
模型大小	1.01TB	1.01TB	1340GB	470.77 GB
推理速度
推理等级
最大输出	4096	134144	8192	16384
支持模式	常规模式（Non-Thinking Mode）	常规模式（Non-Thinking Mode）	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）
开源与许可
代码开源	未开源	未提供	未开源	未提供
权重开源	未开源	未提供	未开源	未提供
商业授权	免费商用授权	免费商用授权	免费商用授权	免费商用授权
模态支持
文本输入/输出	/	/	/	/
图片输入/输出	/	/	/	/
音频输入/输出	/	/	/	/
视频输入/输出	/	/	/	/
Embedding 输入/输出	/	/	/	/
API 接口详情
文本价格	输入: 0.60 美元/ 100 万tokens输出: 2.5 美元/ 100 万tokens	输入: 0.6 美元/100 万tokens输出: 2.5 美元/100 万tokens	输入: 0.56 美元/100 万tokens输出: 1.68 美元/100 万tokens	未提供
图片 API 价格	未提供	未提供	未提供	未提供
音频 API 价格	未提供	未提供	未提供	未提供
视频 API 价格	未提供	未提供	未提供	未提供
Embedding API 价格	未提供	未提供	未提供	未提供
资源与链接
GitHub	未提供	仓库	未提供	仓库
Hugging Face	模型页	模型页	模型页	模型页
官方页面	未提供	未提供	未提供	未提供
实用指南	未提供	未提供	未提供	未提供
论文/报告		Kimi K2: Open Agentic Intelligence	DeepSeek-V3.1 Release	Qwen3-Coder: Agentic Coding in the World
DataLearnerAI	Moonshot AI发布Kimi K2-Instruct-0905：256K上下文长度加持，全面升级的开放式智能体模型	Kimi开源K2大模型：全球首个开源可商用的1万亿参数规模大模型，MoE架构，评测结果与DeepSeekV3相当，但模型文件有1TB！	DeepSeek V4没有等到，但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了，小幅更新，但核心架构和参数不变	阿里开源全新编程大模型Qwen3-Coder-480B-A35B，官方宣称其编程水平接近Claude Sonnet 4，免费开源可商用，同时开源Claude Code免费平替选择Qwen Code

API 价格

API 价格对比

输入输出 token 价格并排展示

Loading comparison...

大模型评测对比结果

自动展示选中模型的核心信息与各评测得分，可左右滑动查看完整表格。当前对比 4 个模型的评测数据与核心参数。

Kimi K2 0905Kimi K2DeepSeek-V3.1Qwen3-Coder-480B-A35B

规格对比

Moonshot AI

Kimi K2 0905

Kimi K2-Instruct-0905

发布时间2025-09-05

上下文256K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

Moonshot AI

Kimi K2

Kimi-K2-0711-Preview

发布时间2025-07-11

上下文131K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

DeepSeek-AI

DeepSeek-V3.1

发布时间2025-08-20

上下文128K

参数量6710

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

阿里巴巴

Qwen3-Coder-480B-A35B

Qwen3-Coder-480B-A35B-Instruct

发布时间2025-07-23

上下文256K

参数量4800

常规模式（Non-Thinking Mode）

查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

性能评测对比

支持不同模式与工具的榜单对比。

全部模式 · 去除并行

展示视图

Thinking 模式（默认）

Thinking 模式（默认） - Help

Default: Thinking 模式（默认） (Standard/Medium)
All: Thinking 模式（全部）

全部工具

并行

Best Overall

Kimi K2 0905 · 52.65

Best Single

DeepSeek-V3.1 · AIME2025 88.40

Thinking 模式（默认）

Kimi K2 0905 · 1 全部模式

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

筛选: 全部模式 · 去除并行3 全部模式 · 4 评测基准

图表加载中...

评测得分表格

完整列出各模型/模式的评测得分，便于横向比较。

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

4 评测基准3 全部模式

支持模式:常规思考深思工具并行

评测基准	KI Kimi K2 0905Moonshot AI	DE DeepSeek-V3.1DeepSeek-AI	QW Qwen3-Coder-480B-A35B阿里巴巴
评测基准
综合评估
HLE	21.70	15.90	—
编程与软件工程
SWE-bench Verified	69.20	—	67.00
数学推理
AIME2025	75.20	88.40	—
AI Agent - 工具使用
Terminal-Bench	44.50	—	37.50

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格	KI Kimi K2 0905Moonshot AI	KI Kimi K2Moonshot AI	DE DeepSeek-V3.1DeepSeek-AI	QW Qwen3-Coder-480B-A35B阿里巴巴
模型信息卡片
开发机构	Moonshot AI	Moonshot AI	DeepSeek-AI	阿里巴巴
模型全名	Kimi K2-Instruct-0905	Kimi-K2-0711-Preview	DeepSeek-V3.1	Qwen3-Coder-480B-A35B-Instruct
模型简介	未提供	未提供	未提供	未提供
模型类型	聊天大模型	聊天大模型	聊天大模型	编程大模型
模型代号	kimi-k2-0905	kimi-k2-0711-base-preview	deepseek-v-3_1	Qwen3-Coder-480B-A35B-Instruct
发布时间	2025-09-05	2025-07-11	2025-08-20	2025-07-23
MoE 架构	支持	支持	支持	支持
规格与性能
上下文	256K	131K	128K	256K
参数量	10000	10000	6710	4800
激活参数量	320	320	370	350
模型规模	100b	100b	100b	100b
模型大小	1.01TB	1.01TB	1340GB	470.77 GB
推理速度
推理等级
最大输出	4096	134144	8192	16384
支持模式	常规模式（Non-Thinking Mode）	常规模式（Non-Thinking Mode）	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）
开源与许可
代码开源	未开源	未提供	未开源	未提供
权重开源	未开源	未提供	未开源	未提供
商业授权	免费商用授权	免费商用授权	免费商用授权	免费商用授权
模态支持
文本输入/输出	/	/	/	/
图片输入/输出	/	/	/	/
音频输入/输出	/	/	/	/
视频输入/输出	/	/	/	/
Embedding 输入/输出	/	/	/	/
API 接口详情
文本价格	输入: 0.60 美元/ 100 万tokens输出: 2.5 美元/ 100 万tokens	输入: 0.6 美元/100 万tokens输出: 2.5 美元/100 万tokens	输入: 0.56 美元/100 万tokens输出: 1.68 美元/100 万tokens	未提供
图片 API 价格	未提供	未提供	未提供	未提供
音频 API 价格	未提供	未提供	未提供	未提供
视频 API 价格	未提供	未提供	未提供	未提供
Embedding API 价格	未提供	未提供	未提供	未提供
资源与链接
GitHub	未提供	仓库	未提供	仓库
Hugging Face	模型页	模型页	模型页	模型页
官方页面	未提供	未提供	未提供	未提供
实用指南	未提供	未提供	未提供	未提供
论文/报告		Kimi K2: Open Agentic Intelligence	DeepSeek-V3.1 Release	Qwen3-Coder: Agentic Coding in the World
DataLearnerAI	Moonshot AI发布Kimi K2-Instruct-0905：256K上下文长度加持，全面升级的开放式智能体模型	Kimi开源K2大模型：全球首个开源可商用的1万亿参数规模大模型，MoE架构，评测结果与DeepSeekV3相当，但模型文件有1TB！	DeepSeek V4没有等到，但是DeepSeekAI把DeepSeek V3升级到DeepSeek V3.1了，小幅更新，但核心架构和参数不变	阿里开源全新编程大模型Qwen3-Coder-480B-A35B，官方宣称其编程水平接近Claude Sonnet 4，免费开源可商用，同时开源Claude Code免费平替选择Qwen Code

API 价格

API 价格对比

输入输出 token 价格并排展示

Kimi K2 0905

Kimi K2

DeepSeek-V3.1

Qwen3-Coder-480B-A35B

性能评测对比

评测得分对比

评测得分表格

评测得分对比

能力与规格明细

模型信息卡片

规格与性能

开源与许可

模态支持

API 接口详情

资源与链接

API 价格对比

Kimi K2 0905

Kimi K2

DeepSeek-V3.1

Qwen3-Coder-480B-A35B

性能评测对比

评测得分对比

评测得分表格

评测得分对比

能力与规格明细

模型信息卡片

规格与性能

开源与许可

模态支持

API 接口详情

资源与链接

API 价格对比