GE

Gemini 2.5-Pro

推理大模型Gemini ProGemini 2.5

Gemini 2.5-Pro

发布时间: 2025-06-05更新于: 2025-11-18 23:24:241,959

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

1000K

中文支持

支持

推理能力

Gemini 2.5-Pro 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2025-06-05，定位为推理大模型，上下文长度为 1000K，采用不开源许可，在 CodeClash 上取得 1125.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 2.5-Pro

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

1000K tokens

最大输出长度

64K tokens

模型类型

推理大模型

输入/输出模态

文本、图像 → 文本

发布时间

2025-06-05

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Gemini 2.5-Pro

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.google.com/

Gemini 2.5-Pro

官方介绍与博客

官方论文

Try the latest Gemini 2.5 Pro before general availability.

DataLearnerAI博客

Google发布Gemini 2.5 Pro: Gemini系列第一个2.5版本的模型，最高支持200万上下文，全模态输入，推理大模型，LMArena排名第一

Gemini 2.5-Pro

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

Gemini 2.5-Pro

评测结果

Gemini 2.5-Pro 当前已收录的代表性评测结果包括 MATH-500（1 / 44，得分 98.80）、Aider-Polyglot（4 / 59，得分 83.10）、AIME 2024（9 / 62，得分 92）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 6 项评测

评测名称 / 模式

得分

排名/总数

86.40

42 / 179

86

20 / 126

高

58.33

76 / 115

37

47 / 65

21.60

99 / 159

4.90

44 / 59

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总数

54

10 / 45

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总数

常规模式工具

1125

6 / 8

77.10

34 / 120

SWE-bench Verified

67.20

68 / 108

数学推理

共 9 项评测

评测名称 / 模式

得分

排名/总数

98.80

1 / 44

92

9 / 62

88

43 / 106

55.20

3 / 16

19

2 / 10

IMO-ProofBench Advanced

17.60

4 / 8

15.20

3 / 9

11

23 / 60

FrontierMath - Tier 4

常规模式

2.10

56 / 80

写作和创作

共 1 项评测

评测名称 / 模式

得分

排名/总数

Creative Writing

85.85

8 / 23

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

32.60

46 / 46

25.30

28 / 35

多模态理解

共 1 项评测

评测名称 / 模式

得分

排名/总数

82

9 / 28

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

思考模式

62.40

11 / 63

Agent能力评测

共 4 项评测

评测名称 / 模式

得分

排名/总数

32K

83.10

4 / 59

思考模式

79.10

8 / 59

τ²-Bench - Telecom

54

32 / 35

Terminal Bench Hard

25

12 / 13

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

49

28 / 29

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

7.80

44 / 45

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

22

21 / 21

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

66

8 / 13

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Gemini 2.5-Pro

发布机构

Google Deep Mind

查看发布机构详情

Gemini 2.5-Pro

模型解读

----2025年6月17日更新：谷歌正式发布Gemini 2.5 Pro模型，其实就是本预览版模型，没有任何变化，只是去掉了Preview标签

Gemini-2.5-Pro-Preview-06-05是谷歌Gemini 2.5 Pro正式版前最后一个预览版本，该模型的训练知识截止到2025年1月份，与之前的版本一样，应该是后训练提升。官方表示，这个新版本在未来几周内将成为正式发布的稳定版本，为企业级规模的应用做好准备。

根据官方发布的信息，Gemini 2.5 Pro 在多个行业基准测试中展现了显著的性能跃升。在 LMArena 评估中，其 Elo 得分跃升了 24 点，以 1470 分保持领先地位。同时，在 WebDevArena 上的 Elo 得分也大幅提升了 35 点，以 1443 分位居榜首。

此外该模型在编码能力方面也表现出色，尤其在 Aider Polyglot 等高难度编码基准测试中处于领先。在评估模型数学、科学、知识和推理能力的 GPQA 和 Humanity's Last Exam (HLE) 等高难度基准测试中，Gemini 2.5 Pro 也展示了顶级的性能。基本都是业界最强的水平。

除了性能数据的提升，谷歌还表示，此次更新采纳了先前版本的用户反馈，对模型的风格和结构进行了改进，使其能够生成更具创造性和格式更优的回复。

开发者现在可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 开始使用升级后的 2.5 Pro 预览版。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码