Gemini 2.5 Flash

Name: Gemini 2.5 Flash
Availability: InStock
Author: Google Deep Mind

推理大模型

Gemini 2.5 Flash

发布时间: 2025-04-17更新于: 2025-04-21 12:49:272,048

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

1000K

中文支持

支持

推理能力

Gemini 2.5 Flash 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2025-04-17，定位为推理大模型，上下文长度为 1000K，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 2.5 Flash

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

1000K tokens

最大输出长度

65536 tokens

模型类型

推理大模型

发布时间

2025-04-17

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Gemini 2.5 Flash

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.google.com/app

Gemini 2.5 Flash

官方介绍与博客

官方论文

Start building with Gemini 2.5 Flash

DataLearnerAI博客

谷歌发布新一代大模型Gemini 2.5 Flash，成本、速度和性能的最优均衡，同时支持推理和非推理模式，评测结果超Sonnet 3.7

Gemini 2.5 Flash

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$0.15	$0.6
图片	$0.15	--
音频	$1	--
视频	$0.15	--

Gemini 2.5 Flash

评测结果

Gemini 2.5 Flash 当前已收录的代表性评测结果包括 AIME 2024（16 / 62，得分 88）、GPQA Diamond（51 / 166，得分 82.80）、IMO 2024（6 / 10，得分 7.80）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

开启

82.80

51 / 166

LiveBench

开启

64.35

34 / 51

HLE

开启

100 / 128

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总数

SimpleQA

开启

26.90

27 / 45

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

开启

55.40

72 / 109

SWE-bench Verified

开启

48.90

81 / 95

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

开启

72 / 107

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

Aider-Polyglot

开启

56.70

20 / 26

查看评测深度分析与其他模型对比

Gemini 2.5 Flash

发布机构

Google Deep Mind

查看发布机构详情

Gemini 2.5 Flash

模型解读

2025年4月17日，谷歌推出了其最新模型Gemini 2.5 Flash，这是一款高效、低成本且具备强大推理能力的AI模型。令牌（token）是AI模型处理文本的最小单位，100万个令牌的上下文窗口意味着该模型能够处理极长的文本序列。多模态（multimodal）指模型能够处理多种输入类型，如文本、图像和音频。本文将详细探讨Gemini 2.5 Flash的上下文长度、独特功能、性能指标及开发者可用性，为读者提供全面的了解。

上下文长度

Gemini 2.5 Flash的一个显著特点是其100万个令牌的上下文窗口。这使得模型能够一次性处理和理解大量数据，例如长篇文档、长时间对话或大规模数据集。这种能力对于需要深度上下文理解的任务尤为重要，例如法律文件分析、学术研究或交互式模拟。根据Google DeepMind的介绍，这一特性使其在长上下文处理方面处于行业领先地位，为复杂应用场景提供了强大支持。

独特功能

Gemini 2.5 Flash作为一款混合推理模型，在Gemini 2.0 Flash的基础上进行了显著升级，提供了多项独特功能：

灵活的推理控制

Gemini 2.5 Flash是谷歌首个完全混合推理模型，开发者可以选择开启或关闭“思考”功能。对于简单任务，关闭思考可保持低延迟和高速度；对于复杂任务，开启思考则能提升响应质量。开发者还可以通过设置“思考预算”来优化质量、成本和延迟的平衡，这一功能在Google AI Gemini API文档中有详细描述。这种灵活性为开发者提供了对资源使用的精细控制。

多模态和多语言支持

该模型支持原生多模态输入，包括文本、音频、图像和视频，使其适用于多样化的应用场景，例如多媒体内容分析或跨模态数据处理。此外，它支持30多种语言，包括英语、西班牙语、法语、中文和阿拉伯语等，显著提升了全球可用性。语言支持的完整列表可在Google Cloud Vertex AI中找到。

成本效益和速度

Gemini 2.5 Flash专为低延迟和高成本效益设计，适合日常任务如文本摘要、聊天应用、数据提取和字幕生成。相比Gemini 2.5 Pro，它规模更小、成本更低，适合大规模部署。根据Google Developers Blog，该模型在性能与成本之间达到了优化的平衡。

自动推理调整

在Gemini app中，Gemini 2.5 Flash能根据输入提示的复杂性自动调整推理程度，无需手动干预即可实现最佳性能。这一动态思考功能提升了用户体验，特别适合交互式应用场景。

开发者可访问性

目前，Gemini 2.5 Flash处于预览阶段，开发者可通过Google AI Studio和Vertex AI进行测试。它还集成在Gemini app中，支持Canvas功能，允许用户协作处理文本或代码。定价信息可在Google AI定价页面查看。

性能指标

Gemini 2.5 Flash在多项基准测试中表现出色，展示了其在推理、科学、数学和编码任务中的强大能力。以下是部分关键基准测试结果，数据来源于Google DeepMind：

基准测试	指标	Gemini 2.5 Flash分数	比较模型（选定分数）
推理与知识（Humanity's Last Exam，无工具）	Pass@1	18.8%	14.0%（OpenAI o3-mini High），6.4%（OpenAI GPT-4.5）
科学（GPQA Diamond）	Pass@1	84.0%	79.7%（OpenAI o3-mini High），71.4%（OpenAI GPT-4.5）
数学（AIME 2025）	Pass@1	86.7%	86.5%（OpenAI o3-mini High），49.5%（Claude 3.7 Sonnet）
数学（AIME 2024）	Pass@1	92.0%	87.3%（OpenAI o3-mini High），36.7%（OpenAI GPT-4.5）
代码生成（LiveCodeBench v5）	Pass@1	70.4%	74.1%（OpenAI o3-mini High），70.6%（Grok 3 Beta Extended）
代码编辑（Aider Polyglot，diff）	Pass@1	68.6%	60.4%（OpenAI o3-mini High），44.9%（OpenAI GPT-4.5）
代理式编码（SWE-bench Verified）	Pass@1	63.8%	49.3%（OpenAI o3-mini High），38.0%（OpenAI GPT-4.5）
事实性（SimpleQA）	Pass@1	52.9%	13.8%（OpenAI o3-mini High），62.5%（OpenAI GPT-4.5）
视觉推理（MMMU）	Pass@1	81.7%	74.4%（OpenAI GPT-4.5），75.0%（Claude 3.7 Sonnet）
图像理解（Vibe-Eval，Reka）	分数	69.4%	无MM支持的其他模型
长上下文（MRCR 1M，pointwise）	Pass@1	83.1%	—
多语言性能（Global MMLU，Lite）	分数	89.8%	—

这些结果表明，Gemini 2.5 Flash在多个领域均表现出色，尤其是在科学和数学任务中，优于许多竞争模型。此外，它在LMArena AI排行榜上名列前茅，尽管略逊于Gemini 2.5 Pro（Mashable报道）。其性能与成本的平衡使其成为开发者和企业的理想选择。

可用性与未来发展

截至2025年4月18日，Gemini 2.5 Flash处于预览阶段，开发者可以通过Google AI Studio和Vertex AI进行测试和反馈。谷歌正在积极收集开发者意见，特别是在动态思考功能的优化方面，计划根据反馈进一步完善模型，并推动其进入全面生产使用阶段。更多信息可参考Google Developers Blog。

此外，Gemini 2.5 Flash已集成在Gemini app中，支持Canvas等交互功能，为用户提供了协作处理文本和代码的平台。根据Ars Technica，谷歌计划在未来为该模型添加深度研究支持，进一步扩展其应用范围。

结论

Gemini 2.5 Flash是一款功能强大、性能卓越且成本效益高的AI模型。其100万个令牌上下文窗口、先进的混合推理能力以及多模态和多语言支持，使其适用于从聊天机器人到复杂数据分析的广泛场景。优异的基准测试成绩和开发者友好的功能（如思考预算和Canvas支持）进一步增强了其吸引力。随着预览阶段的推进和开发者反馈的融入，Gemini 2.5 Flash有望在AI开发领域发挥重要作用，尤其是在可扩展、成本效益高的解决方案中。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送