DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

MiniMax-M1与其它模型在不同评测上的对比结果

2025/06/17 13:52:07
343 阅读
CategoryTaskMiniMax-M1-80KMiniMax-M1-40KQwen3-235B-A22BDeepSeek-R1-0528DeepSeek-R1Seed-Thinking-v1.5Claude 4 OpusGemini 2.5 Pro (06-05)OpenAI-o3
Extended Thinking80K40K32k64k32k32k64k64k100k
MathematicsAIME 202486.083.385.791.479.886.776.092.091.6
AIME 202576.974.681.587.570.074.075.588.088.9
MATH-50096.896.096.298.097.396.798.298.898.1
General CodingLiveCodeBench (24/8~25/5)65.062.365.973.155.967.556.677.175.8
FullStackBench68.367.662.969.470.169.970.3--69.3
Reasoning & KnowledgeGPQA Diamond70.069.271.181.071.577.379.686.483.3
HLE (no tools)8.4*7.2*7.6*17.7*8.6*8.210.721.620.3
ZebraLogic86.880.180.395.178.784.495.191.695.8
MMLU-Pro81.180.683.085.084.087.085.086.085.0
Software EngineeringSWE-bench Verified56.055.634.457.649.247.072.567.269.1
Long ContextOpenAI-MRCR (128k)73.476.127.751.535.854.348.976.856.5
OpenAI-MRCR (1M)56.258.6----------58.8--
LongBench-v261.561.050.152.158.352.555.665.058.8
Agentic Tool UseTAU-bench (airline)62.060.034.753.5--44.059.650.052.0
TAU-bench (retail)63.567.858.663.9--55.781.467.073.9
FactualitySimpleQA18.517.911.027.830.112.9--54.049.4
General AssistantMultiChallenge44.744.740.045.040.743.045.851.856.5

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • 1
  • 谈一谈使用Codex、Claude Code重构现有Web系统(DataLearnerAI)的一点点
  • 在 API 和 ChatGPT 之间迷路?GPT-5.1、GPT-5.1-Chat、GPT-5.1 Instant 的真正区别解释(DataLearnerAI)
  • key和openai
  • DocVQA:文档视觉问答基准详解
  • AI Agent时代如何写Prompt?来自Manus官方的最新的Context Engineering技巧总结
  • 11
  • 备份资料

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用