DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 联系我们

© 2025 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面目录
目录
  1. 首页
  2. 模型对比
  3. 对比结果
DataLearnerAI · 对比结果

DataLearnerAI 大模型对比结果 & 评测数据

自动展示选中模型的核心信息与各评测得分,可左右滑动查看完整表格。DataLearnerAI 基于公开网络采集与整理的模型指标与描述。 当前展示 3 个模型,左右滑动可查看更多。

GPT-5.2Claude Opus 4.5Gemini 3.0 Pro (Preview 11-2025)
OpenAI

GPT-5.2

GP

OpenAI GPT-5.2

发布时间2025-12-11
上下文400K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
查看详情在线体验
Anthropic

Claude Opus 4.5

CL

Anthropic Claude Opus 4.5

发布时间2025-11-25
上下文200K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
查看详情在线体验
Google Deep Mind

Gemini 3.0 Pro (Preview 11-2025)

GE

Gemini 3.0 Pro preview-11-2025

发布时间2025-11-18
上下文1000K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

模式筛选

选择思考模式 / 工具使用 / 是否去除并行,更新下方柱状对比。

全部模式
快捷组合
思考模式
工具 & 并行

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

当前筛选:全部模式10 个模式 · 10 项评测

综合最佳

当前筛选下的平均得分领先

GPT-5.2 · 平均 68.43

单项最强

单个评测的最高得分

GPT-5.2 在 AIME2025 中拿到 100.00

思考模式

当前筛选下的推理/思考模式覆盖

Claude Opus 4.5 · 4 个思考/深度模式

评测得分表格

完整列出各模型/模式的评测得分,便于横向比较。

评测得分表格

评测基准对比

直观查看各模型/模式在每个评测基准上的得分。

10 项评测10 个模式
模型评测模式说明:常规模式思考模式深思模式使用工具并行/多智能体
评测基准
GP
GPT-5.2OpenAI
CL
Claude Opus 4.5Anthropic
GE
Gemini 3.0 Pro (Preview 11-2025)Google Deep Mind
综合评估
ARC-AGI
86.20—40.00——80.00—87.5075.00—
ARC-AGI-2
52.90—7.80——37.60—45.1031.10—
GPQA Diamond
92.40————87.00—93.8091.90—
HLE
34.5045.50———30.8043.2041.0037.50—
LiveBench
—73.67—75.5874.87———74.14—
编程与软件工程
SWE-bench Verified
80.00————80.90——76.20—
数学推理
AIME2025
100.00———————95.00—
FrontierMath
40.30————20.70——38.00—
FrontierMath - Tier 4
14.60————4.20——19.00—
Agent能力评测
τ²-Bench - Telecom
—98.70————90.70——98.00

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格
GP
GPT-5.2OpenAI
CL
Claude Opus 4.5Anthropic
GE
Gemini 3.0 Pro (Preview 11-2025)Google Deep Mind

模型信息卡片

开发机构
OpenAIAnthropicGoogle Deep Mind
模型全名
OpenAI GPT-5.2Anthropic Claude Opus 4.5Gemini 3.0 Pro preview-11-2025
模型简介
未提供未提供未提供
模型类型
聊天大模型推理大模型多模态大模型
模型代号
openai-gpt-5-2anthropic-claude-opus-4-5gemini-3-0-pro-preview-11-2025
发布时间
2025-12-112025-11-252025-11-18
MoE 架构
不支持不支持不支持

规格与性能

上下文
400K200K1000K
参数量
———
激活参数量
未提供未提供未提供
模型规模
未知未知未知
模型大小
未提供未提供未提供
推理速度
推理等级
最大输出
未提供6553665536
支持模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)

开源与许可

代码开源
未提供未提供未提供
权重开源
未提供未提供未提供
商业授权
不开源不开源不开源

模态支持

文本 输入/输出
/
/
/
图片 输入/输出
/
/
/
音频 输入/输出
/
/
/
视频 输入/输出
/
/
/
Embedding 输入/输出
/
/
/

API 接口详情

文本 价格
输入:1.75 美元/100 万tokens输出:14 美元/100 万tokens缓存价:0.175 美元/100 万tokens
输入:5 美元/100 万tokens输出:25 美元/100 万tokens缓存价:6.25 美元/100 万tokens
输入:2 美元/100万 tokens输出:12 美元/100万 tokens输入超长:4 美元/100万 tokens输出超长:18 美元/100万 tokens超长阈值:200K
图片 价格
未提供未提供未提供
音频 价格
未提供未提供未提供
视频 价格
未提供未提供未提供
Embedding 价格
未提供未提供未提供

资源与链接

GitHub
未提供未提供未提供
Hugging Face
未提供未提供未提供
官方页面
未提供未提供未提供
实用指南
未提供未提供未提供
论文/报告
Introducing GPT-5.2Introducing Claude Opus 4.5A new era of intelligence with Gemini 3
DataLearnerAI 博客
未提供未提供大模型新王者!谷歌发布Gemini 3.0 Pro,各方面评测几乎都是第一,全球首个大模型匿名投票得分超1500分的模型,支持100万输入上下文!

API 价格

API 价格对比

输入输出 token 价格并排展示

模型数据收集自官网、Artificial Analysis等页面