模型评测对比最新基准汇总

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型对比

本页面提供Devstral Small 1.0,DeepSeek-R1,GPT-4.1,Devstral Small 1.1模型的对比，包括参数、开源情况、API价格等。同时，页面也会展示Devstral Small 1.0,DeepSeek-R1,GPT-4.1,Devstral Small 1.1模型在SWE-bench Verified等评测基准中的详细对比数据，评测数据来自系统收录结果汇总。

📊 左右滑动可查看更多模型数据 →

Devstral Small 1.0

MistralAI 发布的编程大模型模型。

了解更多在线体验

核心信息

开发机构

MistralAI

发布时间 2025-05-26

模型类型编程大模型

MoE 架构

性能与规格

总参数量 240 亿

激活参数量 240 亿

模型大小 48GB

推理能力

推理速度

思考模式

深度思考

最大上下文 128K

最大输出 4096

支持模态

Input

Output

开源与许可

代码开源 --

权重开源 --

商业用途免费商用授权

相关资源

论文/报告查看

模型详细介绍 --

相关链接

DeepSeek-R1

DeepSeek-AI 发布的推理大模型模型。

了解更多无体验地址

核心信息

开发机构

DeepSeek-AI

发布时间 2025-01-20

模型类型推理大模型

MoE 架构

性能与规格

总参数量 6,710 亿

激活参数量未公开

模型大小 134GB

推理能力暂无数据

推理速度暂无数据

思考模式

深度思考

最大上下文 128K

最大输出 0

支持模态

Input

Output

开源与许可

代码开源否

权重开源否

商业用途免费商用授权

相关资源

论文/报告查看

模型详细介绍阅读

相关链接

GPT-4.1

OpenAI 发布的聊天大模型模型。

了解更多无体验地址

核心信息

开发机构

OpenAI

发布时间 2025-04-14

模型类型聊天大模型

MoE 架构

性能与规格

总参数量未公开

激活参数量未公开

模型大小

推理能力

推理速度

思考模式

深度思考

最大上下文 1024K

最大输出 32768

支持模态

Input

Output

开源与许可

代码开源 --

权重开源 --

商业用途不开源

相关资源

论文/报告查看

模型详细介绍 --

相关链接

Devstral Small 1.1

MistralAI 发布的编程大模型模型。

了解更多在线体验

核心信息

开发机构

MistralAI

发布时间 2025-07-10

模型类型编程大模型

MoE 架构

性能与规格

总参数量 240 亿

激活参数量 240 亿

模型大小 48GB

推理能力

推理速度

思考模式

深度思考

最大上下文 128K

最大输出 4096

支持模态

Input

Output

开源与许可

代码开源 --

权重开源 --

商业用途免费商用授权

相关资源

论文/报告查看

模型详细介绍阅读

相关链接

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型各评测基准得分对比表

评测基准	Devstral Small 1.0 normal	DeepSeek-R1 normal	GPT-4.1 normal	Devstral Small 1.1 normal
SWE-bench Verified 编程与软件工程	46.8	49.2	54.6	53.6

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型评测结果汇总对比图

蓝色柱状系列表示选定模型 Devstral Small 1.0 在不同模式下的表现

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型对比

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型各评测基准得分对比表

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型评测结果汇总对比图

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型的API价格对比图 (文本输入/输出)

Devstral Small 1.0与DeepSeek-R1、GPT-4.1、Devstral Small 1.1模型在各评测基准详细对比