DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Gemini 2.5 Flash
GE

Gemini 2.5 Flash

推理大模型

Gemini 2.5 Flash

发布时间: 2025-04-17更新于: 2025-04-21 12:49:272,048
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1000K
中文支持
支持
推理能力

Gemini 2.5 Flash 是由 Google Deep Mind 发布的 AI 模型,发布时间为 2025-04-17,定位为 推理大模型,上下文长度为 1000K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 2.5 Flash

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
1000K tokens
最大输出长度
65536 tokens
模型类型
推理大模型
发布时间
2025-04-17
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
Gemini 2.5 Flash

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://gemini.google.com/app
Gemini 2.5 Flash

官方介绍与博客

官方论文
Start building with Gemini 2.5 Flash
DataLearnerAI博客
谷歌发布新一代大模型Gemini 2.5 Flash,成本、速度和性能的最优均衡,同时支持推理和非推理模式,评测结果超Sonnet 3.7
Gemini 2.5 Flash

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.15$0.6
图片$0.15--
音频$1--
视频$0.15--
Gemini 2.5 Flash

评测结果

Gemini 2.5 Flash 当前已收录的代表性评测结果包括 AIME 2024(16 / 62,得分 88)、GPQA Diamond(51 / 166,得分 82.80)、IMO 2024(6 / 10,得分 7.80)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考
思考模式细分 (1)
全部默认 (开启)
工具使用
全部使用工具不使用工具

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
开启
82.80
51 / 166
LiveBench
开启
64.35
34 / 51
HLE
开启
11
100 / 128

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
开启
26.90
27 / 45

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
开启
55.40
72 / 109
SWE-bench Verified
开启
48.90
81 / 95

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
开启
72
72 / 107

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
Aider-Polyglot
开启
56.70
20 / 26
查看评测深度分析与其他模型对比
Gemini 2.5 Flash

发布机构

Google Deep Mind
Google Deep Mind
查看发布机构详情
Gemini 2.5 Flash

模型解读

2025年4月17日,谷歌推出了其最新模型Gemini 2.5 Flash,这是一款高效、低成本且具备强大推理能力的AI模型。令牌(token)是AI模型处理文本的最小单位,100万个令牌的上下文窗口意味着该模型能够处理极长的文本序列。多模态(multimodal)指模型能够处理多种输入类型,如文本、图像和音频。本文将详细探讨Gemini 2.5 Flash的上下文长度、独特功能、性能指标及开发者可用性,为读者提供全面的了解。

上下文长度

Gemini 2.5 Flash的一个显著特点是其100万个令牌的上下文窗口。这使得模型能够一次性处理和理解大量数据,例如长篇文档、长时间对话或大规模数据集。这种能力对于需要深度上下文理解的任务尤为重要,例如法律文件分析、学术研究或交互式模拟。根据Google DeepMind的介绍,这一特性使其在长上下文处理方面处于行业领先地位,为复杂应用场景提供了强大支持。

独特功能

Gemini 2.5 Flash作为一款混合推理模型,在Gemini 2.0 Flash的基础上进行了显著升级,提供了多项独特功能:

灵活的推理控制

Gemini 2.5 Flash是谷歌首个完全混合推理模型,开发者可以选择开启或关闭“思考”功能。对于简单任务,关闭思考可保持低延迟和高速度;对于复杂任务,开启思考则能提升响应质量。开发者还可以通过设置“思考预算”来优化质量、成本和延迟的平衡,这一功能在Google AI Gemini API文档中有详细描述。这种灵活性为开发者提供了对资源使用的精细控制。

多模态和多语言支持

该模型支持原生多模态输入,包括文本、音频、图像和视频,使其适用于多样化的应用场景,例如多媒体内容分析或跨模态数据处理。此外,它支持30多种语言,包括英语、西班牙语、法语、中文和阿拉伯语等,显著提升了全球可用性。语言支持的完整列表可在Google Cloud Vertex AI中找到。

成本效益和速度

Gemini 2.5 Flash专为低延迟和高成本效益设计,适合日常任务如文本摘要、聊天应用、数据提取和字幕生成。相比Gemini 2.5 Pro,它规模更小、成本更低,适合大规模部署。根据Google Developers Blog,该模型在性能与成本之间达到了优化的平衡。

自动推理调整

在Gemini app中,Gemini 2.5 Flash能根据输入提示的复杂性自动调整推理程度,无需手动干预即可实现最佳性能。这一动态思考功能提升了用户体验,特别适合交互式应用场景。

开发者可访问性

目前,Gemini 2.5 Flash处于预览阶段,开发者可通过Google AI Studio和Vertex AI进行测试。它还集成在Gemini app中,支持Canvas功能,允许用户协作处理文本或代码。定价信息可在Google AI定价页面查看。

性能指标

Gemini 2.5 Flash在多项基准测试中表现出色,展示了其在推理、科学、数学和编码任务中的强大能力。以下是部分关键基准测试结果,数据来源于Google DeepMind:

基准测试指标Gemini 2.5 Flash分数比较模型(选定分数)
推理与知识(Humanity's Last Exam,无工具)Pass@118.8%14.0%(OpenAI o3-mini High),6.4%(OpenAI GPT-4.5)
科学(GPQA Diamond)Pass@184.0%79.7%(OpenAI o3-mini High),71.4%(OpenAI GPT-4.5)
数学(AIME 2025)Pass@186.7%86.5%(OpenAI o3-mini High),49.5%(Claude 3.7 Sonnet)
数学(AIME 2024)Pass@192.0%87.3%(OpenAI o3-mini High),36.7%(OpenAI GPT-4.5)
代码生成(LiveCodeBench v5)Pass@170.4%74.1%(OpenAI o3-mini High),70.6%(Grok 3 Beta Extended)
代码编辑(Aider Polyglot,diff)Pass@168.6%60.4%(OpenAI o3-mini High),44.9%(OpenAI GPT-4.5)
代理式编码(SWE-bench Verified)Pass@163.8%49.3%(OpenAI o3-mini High),38.0%(OpenAI GPT-4.5)
事实性(SimpleQA)Pass@152.9%13.8%(OpenAI o3-mini High),62.5%(OpenAI GPT-4.5)
视觉推理(MMMU)Pass@181.7%74.4%(OpenAI GPT-4.5),75.0%(Claude 3.7 Sonnet)
图像理解(Vibe-Eval,Reka)分数69.4%无MM支持的其他模型
长上下文(MRCR 1M,pointwise)Pass@183.1%—
多语言性能(Global MMLU,Lite)分数89.8%—

这些结果表明,Gemini 2.5 Flash在多个领域均表现出色,尤其是在科学和数学任务中,优于许多竞争模型。此外,它在LMArena AI排行榜上名列前茅,尽管略逊于Gemini 2.5 Pro(Mashable报道)。其性能与成本的平衡使其成为开发者和企业的理想选择。

可用性与未来发展

截至2025年4月18日,Gemini 2.5 Flash处于预览阶段,开发者可以通过Google AI Studio和Vertex AI进行测试和反馈。谷歌正在积极收集开发者意见,特别是在动态思考功能的优化方面,计划根据反馈进一步完善模型,并推动其进入全面生产使用阶段。更多信息可参考Google Developers Blog。

此外,Gemini 2.5 Flash已集成在Gemini app中,支持Canvas等交互功能,为用户提供了协作处理文本和代码的平台。根据Ars Technica,谷歌计划在未来为该模型添加深度研究支持,进一步扩展其应用范围。

结论

Gemini 2.5 Flash是一款功能强大、性能卓越且成本效益高的AI模型。其100万个令牌上下文窗口、先进的混合推理能力以及多模态和多语言支持,使其适用于从聊天机器人到复杂数据分析的广泛场景。优异的基准测试成绩和开发者友好的功能(如思考预算和Canvas支持)进一步增强了其吸引力。随着预览阶段的推进和开发者反馈的融入,Gemini 2.5 Flash有望在AI开发领域发挥重要作用,尤其是在可扩展、成本效益高的解决方案中。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码