DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Gemini 3 Deep Think - 2620
GE

Gemini 3 Deep Think - 2620

Gemini 3 Deep Think February 2026 Upgrade

发布时间: 2026-02-13100
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1M
中文支持
不支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 3 Deep Think - 2620

模型基本信息

推理过程
支持
上下文长度
1M tokens
最大输出长度
64000 tokens
模型类型
推理大模型
发布时间
2026-02-13
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
推理模式
深度思考(Deeper Thinking Mode)
Gemini 3 Deep Think - 2620

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://gemini.google.com/
Gemini 3 Deep Think - 2620

官方介绍与博客

官方论文
Gemini 3 Deep Think: Advancing science, research and engineering
DataLearnerAI博客
暂无介绍博客
Gemini 3 Deep Think - 2620

API接口信息

接口速度
2/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本2.0012.00
超上下文计费Extended
模态输入输出
文本4.0018.00
Gemini 3 Deep Think - 2620

评测结果

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
ARC-AGI思考
96
1 / 42
ARC-AGI-2思考
84.60
1 / 33
HLE思考
48.40
8 / 99

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
CodeForces思考
3455
1 / 9
查看评测深度分析与其他模型对比
Gemini 3 Deep Think - 2620

发布机构

Google Deep Mind
Google Deep Mind
查看发布机构详情
Gemini 3 Deep Think February 2026 Upgrade

模型解读

Gemini 3 Deep Think是Google DeepMind于2025年12月4日首次发布的专业推理模式,并于2026年2月13日推出重大升级版本。这是一种基于Gemini 3 Pro构建的高级推理模式,专门设计用于解决科学、研究和工程领域的复杂挑战。与常规的Gemini 3 Pro相比,Deep Think模式采用先进的并行推理技术,能够同时探索多个假设,通过迭代推理过程产生更精细、更深入的解决方案。

该升级版本是与科学家和研究人员密切合作开发的,专注于处理那些缺乏明确边界、没有单一正确答案或数据不完整的复杂研究问题。Deep Think不仅在抽象理论上表现出色,还特别注重实际应用,能够帮助研究人员解读复杂数据,协助工程师通过代码建模物理系统。

性能与基准评测

2026年2月升级版在多个顶级基准测试中取得了突破性成绩。在Humanity's Last Exam(一个专门测试前沿模型极限的基准)上,该模型在不使用外部工具的情况下达到了48.4%的分数,相比12月版本的41.0%有显著提升。在ARC-AGI-2测试中,模型取得了84.6%的验证成绩(由ARC Prize Foundation验证),相比12月版本的45.1%实现了巨大飞跃,这证明了模型在适应全新任务而非依赖记忆模式方面的卓越能力。

在编程竞赛平台Codeforces上,Deep Think达到了3455的Elo评分,处于传奇大师级别,超越了绝大多数人类竞技程序员。模型在2025国际数学奥林匹克、2025国际物理奥林匹克和2025国际化学奥林匹克的笔试部分均达到金牌水平。在高级理论物理的CMT-Benchmark测试中获得50.5%的分数,展现了专业级研究能力。

核心能力与应用场景

Deep Think模式支持文本、图像、视频、音频和代码等多模态输入。其核心能力包括:复杂数据解释、物理系统代码建模、优化问题求解、以及能够将草图转换为3D可打印文件的能力。该模型在实际应用中已被多个研究机构采用,例如罗格斯大学的数学家Lisa Carbone使用Deep Think审查高度技术性的数学论文,成功识别出此前通过人工同行评审未被发现的细微逻辑缺陷;杜克大学的Wang实验室利用Deep Think优化复杂晶体生长的制造方法,用于潜在半导体材料的发现。

推荐应用场景包括:科学研究中的文献审查和假设验证、工程领域的复杂系统建模、高级数学问题求解、竞技编程、物理和化学领域的实验数据分析、以及从概念设计到3D打印的工程实现。

访问方式与限制

2026年2月升级版目前通过两种方式提供访问。Google AI Ultra订阅用户(订阅费用为每月250美元)可以在Gemini应用中直接使用,通过在提示栏中选择Deep Think并在模型下拉菜单中选择Gemini 3 Pro来访问。对于研究人员、工程师和企业用户,Google首次开放了通过Gemini API访问Deep Think的早期体验计划,需要通过申请获得访问权限。

Deep Think模式的响应通常需要几分钟时间完成,这是因为模型采用了更深层次的内部推理过程。该模式继承了Gemini 3 Pro的技术规格,包括100万tokens的输入上下文窗口和最多64,000 tokens的输出容量。

版本差异说明:相比2025年12月4日首次发布的版本,2026年2月13日的升级版在所有主要基准测试上都实现了显著提升,特别是在ARC-AGI-2上从45.1%提升至84.6%,在Humanity's Last Exam上从41.0%提升至48.4%。升级版还首次通过Gemini API向企业和研究机构开放,并增强了在科学研究和工程应用方面的实用性。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码