DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogGemini 2.5 Flash
GE

Gemini 2.5 Flash

Gemini 2.5 Flash

Release date: 2025-04-17更新于: 2025-04-21 12:49:271,754
Live demoGitHubHugging FaceCompare
Parameters
Not disclosed
Context length
1000K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Gemini 2.5 Flash

Model basics

Reasoning traces
Supported
Context length
1000K tokens
Max output length
65536 tokens
Model type
推理大模型
Release date
2025-04-17
Model file size
No data
MoE architecture
No
Total params / Active params
No data / N/A
Knowledge cutoff
No data
Inference modes
No mode data
Gemini 2.5 Flash

Open source & experience

Code license
不开源
Weights license
不开源- 不开源
GitHub repo
GitHub link unavailable
Hugging Face
Hugging Face link unavailable
Live demo
https://gemini.google.com/app
Gemini 2.5 Flash

Official resources

Paper
Start building with Gemini 2.5 Flash
DataLearnerAI blog
谷歌发布新一代大模型Gemini 2.5 Flash,成本、速度和性能的最优均衡,同时支持推理和非推理模式,评测结果超Sonnet 3.7
Gemini 2.5 Flash

API details

API speed
3/5
💡Default unit: $/1M tokens. If vendors use other units, follow their published pricing.
Standard pricingStandard
ModalityInputOutput
Text$0.15$0.6
Image$0.15--
Audio$1--
Video$0.15--
Gemini 2.5 Flash

Benchmark Results

No benchmark data to show.
Gemini 2.5 Flash

Publisher

Google Deep Mind
Google Deep Mind
View publisher details
Gemini 2.5 Flash

Model Overview

2025年4月17日,谷歌推出了其最新模型Gemini 2.5 Flash,这是一款高效、低成本且具备强大推理能力的AI模型。令牌(token)是AI模型处理文本的最小单位,100万个令牌的上下文窗口意味着该模型能够处理极长的文本序列。多模态(multimodal)指模型能够处理多种输入类型,如文本、图像和音频。本文将详细探讨Gemini 2.5 Flash的上下文长度、独特功能、性能指标及开发者可用性,为读者提供全面的了解。

上下文长度

Gemini 2.5 Flash的一个显著特点是其100万个令牌的上下文窗口。这使得模型能够一次性处理和理解大量数据,例如长篇文档、长时间对话或大规模数据集。这种能力对于需要深度上下文理解的任务尤为重要,例如法律文件分析、学术研究或交互式模拟。根据Google DeepMind的介绍,这一特性使其在长上下文处理方面处于行业领先地位,为复杂应用场景提供了强大支持。

独特功能

Gemini 2.5 Flash作为一款混合推理模型,在Gemini 2.0 Flash的基础上进行了显著升级,提供了多项独特功能:

灵活的推理控制

Gemini 2.5 Flash是谷歌首个完全混合推理模型,开发者可以选择开启或关闭“思考”功能。对于简单任务,关闭思考可保持低延迟和高速度;对于复杂任务,开启思考则能提升响应质量。开发者还可以通过设置“思考预算”来优化质量、成本和延迟的平衡,这一功能在Google AI Gemini API文档中有详细描述。这种灵活性为开发者提供了对资源使用的精细控制。

多模态和多语言支持

该模型支持原生多模态输入,包括文本、音频、图像和视频,使其适用于多样化的应用场景,例如多媒体内容分析或跨模态数据处理。此外,它支持30多种语言,包括英语、西班牙语、法语、中文和阿拉伯语等,显著提升了全球可用性。语言支持的完整列表可在Google Cloud Vertex AI中找到。

成本效益和速度

Gemini 2.5 Flash专为低延迟和高成本效益设计,适合日常任务如文本摘要、聊天应用、数据提取和字幕生成。相比Gemini 2.5 Pro,它规模更小、成本更低,适合大规模部署。根据Google Developers Blog,该模型在性能与成本之间达到了优化的平衡。

自动推理调整

在Gemini app中,Gemini 2.5 Flash能根据输入提示的复杂性自动调整推理程度,无需手动干预即可实现最佳性能。这一动态思考功能提升了用户体验,特别适合交互式应用场景。

开发者可访问性

目前,Gemini 2.5 Flash处于预览阶段,开发者可通过Google AI Studio和Vertex AI进行测试。它还集成在Gemini app中,支持Canvas功能,允许用户协作处理文本或代码。定价信息可在Google AI定价页面查看。

性能指标

Gemini 2.5 Flash在多项基准测试中表现出色,展示了其在推理、科学、数学和编码任务中的强大能力。以下是部分关键基准测试结果,数据来源于Google DeepMind:

基准测试指标Gemini 2.5 Flash分数比较模型(选定分数)
推理与知识(Humanity's Last Exam,无工具)Pass@118.8%14.0%(OpenAI o3-mini High),6.4%(OpenAI GPT-4.5)
科学(GPQA Diamond)Pass@184.0%79.7%(OpenAI o3-mini High),71.4%(OpenAI GPT-4.5)
数学(AIME 2025)Pass@186.7%86.5%(OpenAI o3-mini High),49.5%(Claude 3.7 Sonnet)
数学(AIME 2024)Pass@192.0%87.3%(OpenAI o3-mini High),36.7%(OpenAI GPT-4.5)
代码生成(LiveCodeBench v5)Pass@170.4%74.1%(OpenAI o3-mini High),70.6%(Grok 3 Beta Extended)
代码编辑(Aider Polyglot,diff)Pass@168.6%60.4%(OpenAI o3-mini High),44.9%(OpenAI GPT-4.5)
代理式编码(SWE-bench Verified)Pass@163.8%49.3%(OpenAI o3-mini High),38.0%(OpenAI GPT-4.5)
事实性(SimpleQA)Pass@152.9%13.8%(OpenAI o3-mini High),62.5%(OpenAI GPT-4.5)
视觉推理(MMMU)Pass@181.7%74.4%(OpenAI GPT-4.5),75.0%(Claude 3.7 Sonnet)
图像理解(Vibe-Eval,Reka)分数69.4%无MM支持的其他模型
长上下文(MRCR 1M,pointwise)Pass@183.1%—
多语言性能(Global MMLU,Lite)分数89.8%—

这些结果表明,Gemini 2.5 Flash在多个领域均表现出色,尤其是在科学和数学任务中,优于许多竞争模型。此外,它在LMArena AI排行榜上名列前茅,尽管略逊于Gemini 2.5 Pro(Mashable报道)。其性能与成本的平衡使其成为开发者和企业的理想选择。

可用性与未来发展

截至2025年4月18日,Gemini 2.5 Flash处于预览阶段,开发者可以通过Google AI Studio和Vertex AI进行测试和反馈。谷歌正在积极收集开发者意见,特别是在动态思考功能的优化方面,计划根据反馈进一步完善模型,并推动其进入全面生产使用阶段。更多信息可参考Google Developers Blog。

此外,Gemini 2.5 Flash已集成在Gemini app中,支持Canvas等交互功能,为用户提供了协作处理文本和代码的平台。根据Ars Technica,谷歌计划在未来为该模型添加深度研究支持,进一步扩展其应用范围。

结论

Gemini 2.5 Flash是一款功能强大、性能卓越且成本效益高的AI模型。其100万个令牌上下文窗口、先进的混合推理能力以及多模态和多语言支持,使其适用于从聊天机器人到复杂数据分析的广泛场景。优异的基准测试成绩和开发者友好的功能(如思考预算和Canvas支持)进一步增强了其吸引力。随着预览阶段的推进和开发者反馈的融入,Gemini 2.5 Flash有望在AI开发领域发挥重要作用,尤其是在可扩展、成本效益高的解决方案中。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码