GE

Gemini 3.1 Pro Preview

多模态大模型Gemini ProGemini 3.1

Gemini 3.1 Pro Preview

发布时间: 2026-02-20更新于: 2026-03-09 10:26:57知识截止: 2025-016,724
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1M
中文支持
支持
推理能力

Gemini 3.1 Pro Preview 是由 Google Deep Mind 发布的 AI 模型,发布时间为 2026-02-20,定位为 多模态大模型,上下文长度为 1M,采用 不开源 许可,在 τ²-Bench - Telecom 上取得 99.30 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 3.1 Pro Preview

模型基本信息

推理过程
支持
思考模式
思考水平 · 高 (High) (默认)思考水平 · 低 (Low)
上下文长度
1M tokens
最大输出长度
32K tokens
模型类型
多模态大模型
输入/输出模态
暂无数据
发布时间
2026-02-20
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
2025-01
Gemini 3.1 Pro Preview

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
Gemini 3.1 Pro Preview

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Gemini 3.1 Pro Preview

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准模式
类型适用条件输入输出
文本上下文长度 <= 200K$2.00/ 1M$12.00/ 1M
文本上下文长度 > 200K$4.00/ 1M$18.00/ 1M
Gemini 3.1 Pro Preview

评测结果

Gemini 3.1 Pro Preview 当前已收录的代表性评测结果包括 GPQA Diamond(3 / 179,得分 94.30)、LiveCodeBench(3 / 120,得分 91.70)、LiveBench(3 / 115,得分 79.93)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
工具使用
联网能力

综合评估

共 7 项评测
评测名称 / 模式
得分
排名/总数
94.30
3 / 179
MMLU
92.60
3 / 65
79.93
3 / 115
77.10
7 / 59
HLE
44.40
38 / 161
HLE
工具
51.40
17 / 161
0
3 / 6

编程与软件工程

共 4 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
工具
91.70
3 / 120
80.60
10 / 108
54.20
24 / 44
DeepSWE
工具
12
9 / 9

多模态理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
MMMU
80.50
11 / 28

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
79.60
2 / 63

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
99.30
1 / 35
τ²-Bench
工具
90.80
2 / 40

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
36.90
11 / 60
16.70
20 / 80
16.70
20 / 80

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
工具联网
85.90
3 / 46

AI Agent - 工具使用

共 3 项评测
评测名称 / 模式
得分
排名/总数
MCP-Atlas
工具
78.20
6 / 23
70.70
10 / 16
68.50
8 / 46

OpenClaw智能体能力综合测评

共 1 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
思考模式工具
86.70
10 / 37

和其他模型对比

Gemini 3.1 Pro Preview

发布机构

Gemini 3.1 Pro Preview

模型解读

Gemini 3.1 Pro 是近期推出的 Gemini 3 系列新一代模型。该版本聚焦于逻辑推理、代码生成及智能体工作流优化,目前已通过公共预览版提供给开发者和企业用户。以下是基于最新技术规范的模型能力梳理。

一、 基础参数与逻辑基准
Gemini 3.1 Pro 支持文本、图像、视频、音频及PDF等多模态输入。其上下文窗口的输入上限设定为 1,048,576 个 Token,输出上限为 65,536 个 Token。
在评估模型解决未知逻辑模式能力的 ARC-AGI-2 基准测试中,Gemini 3.1 Pro 的得分为 77.1%,是上一代 Gemini 3 Pro 对应成绩的两倍。

二、 纯代码视觉与SVG动画生成
视觉生成逻辑的扩充是该版本的技术更新之一。Gemini 3.1 Pro 支持直接通过文本提示生成适用于 Web 环境的动画 SVG 文件。
与基于像素矩阵的光栅图像生成不同,该模型将视觉元素与动画轨迹转化为纯代码输出。这种生成方式具有两项客观特征:

  1. 无损缩放:输出的矢量图形支持任意比例缩放,能够适配不同分辨率屏幕而不损失清晰度。
  2. 轻量化:在呈现动态视觉效果时,其基于纯代码的结构使得文件体积显著小于常规的视频或 GIF 格式。
    在工程侧,模型能够解析复杂的矢量路径并输出标准化的 XML/SVG 代码。这些代码经过结构化处理,支持直接嵌入前端网页项目,或导入专业的矢量绘图软件进行二次编辑与拆解。

三、 智能体工作流与专属 API 节点
针对软件工程(SWE)任务,模型在 API 层面新增了名为 gemini-3.1-pro-preview-customtools 的独立端点。
该端点针对包含自定义工具调用(如 view_filesearch_code)与 Bash 环境执行的自动化工作流进行了优化。在此机制下,模型在执行长周期代码任务前,能够输出包含架构规划与风险评估的完整链路方案。例如在处理数据库迁移指令时,模型会预先输出包含同步引擎与冲突解决策略的方案架构,随后再切入代码编写阶段。

四、 分发渠道
目前,Gemini 3.1 Pro 预览版已部署至多个产品线。开发者与企业用户可通过 Google AI Studio、Vertex AI、Gemini Enterprise、Android Studio 以及 Google Antigravity 开发平台进行接入。在消费端,该模型向订阅了 Google AI Pro 和 Ultra 计划的 Gemini 应用程序及 NotebookLM 用户开放。

总结
Gemini 3.1 Pro 的技术迭代集中于代码维度的结构化输出与逻辑推理。纯代码驱动的 SVG 动画生成以及专属工具 API 的引入,体现了该模型在前端开发视觉资源生成和自动化代码工程规划场景中的技术设定。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码