Gemini 3.1 Pro Preview

Name: Gemini 3.1 Pro Preview
Price: 2 USD
Availability: InStock
Author: Google Deep Mind

多模态大模型Gemini ProGemini 3.1

发布时间: 2026-02-20更新于: 2026-03-09 10:26:57知识截止: 2025-016,724

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

中文支持

支持

推理能力

Gemini 3.1 Pro Preview 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2026-02-20，定位为多模态大模型，上下文长度为 1M，采用不开源许可，在 τ²-Bench - Telecom 上取得 99.30 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 3.1 Pro Preview

模型基本信息

推理过程

支持

思考模式

思考水平 · 高 (High) (默认)思考水平 · 低 (Low)

上下文长度

1M tokens

最大输出长度

32K tokens

模型类型

多模态大模型

输入/输出模态

暂无数据

发布时间

2026-02-20

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

2025-01

Gemini 3.1 Pro Preview

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.google.com/app

Gemini 3.1 Pro Preview

官方介绍与博客

官方论文

Gemini 3.1 Pro: A smarter model for your most complex tasks

DataLearnerAI博客

暂无介绍博客

Gemini 3.1 Pro Preview

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	上下文长度 <= 200K	$2.00/ 1M	$12.00/ 1M
文本	上下文长度 > 200K	$4.00/ 1M	$18.00/ 1M

Gemini 3.1 Pro Preview

评测结果

Gemini 3.1 Pro Preview 当前已收录的代表性评测结果包括 GPQA Diamond（3 / 179，得分 94.30）、LiveCodeBench（3 / 120，得分 91.70）、LiveBench（3 / 115，得分 79.93）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 7 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

高

94.30

3 / 179

MMLU

高

92.60

3 / 65

LiveBench

高

79.93

3 / 115

ARC-AGI-2

高

77.10

7 / 59

HLE

高

44.40

38 / 161

HLE

高工具

51.40

17 / 161

ARC-AGI-3

高

3 / 6

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

高工具

91.70

3 / 120

SWE-bench Verified

高工具

80.60

10 / 108

SWE-Bench Pro - Public

高工具

54.20

24 / 44

DeepSWE

高工具

9 / 9

多模态理解

共 1 项评测

评测名称 / 模式

得分

排名/总数

MMMU

高

80.50

11 / 28

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

79.60

2 / 63

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

高工具

99.30

1 / 35

τ²-Bench

高工具

90.80

2 / 40

数学推理

共 3 项评测

评测名称 / 模式

得分

排名/总数

FrontierMath

高

36.90

11 / 60

FrontierMath - Tier 4

常规模式

16.70

20 / 80

FrontierMath - Tier 4

高

16.70

20 / 80

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

高工具联网

85.90

3 / 46

AI Agent - 工具使用

共 3 项评测

评测名称 / 模式

得分

排名/总数

MCP-Atlas

高工具

78.20

6 / 23

TerminalBench 2.1

高工具

70.70

10 / 16

Terminal Bench 2.0

高工具

68.50

8 / 46

OpenClaw智能体能力综合测评

共 1 项评测

评测名称 / 模式

得分

排名/总数

Pinch Bench

思考模式工具

86.70

10 / 37

查看评测深度分析与其他模型对比

和其他模型对比

想自定义其他组合？打开对比工具

Gemini 3.1 Pro Preview

发布机构

Google Deep Mind

查看发布机构详情

Gemini 3.1 Pro Preview

模型解读

Gemini 3.1 Pro 是近期推出的 Gemini 3 系列新一代模型。该版本聚焦于逻辑推理、代码生成及智能体工作流优化，目前已通过公共预览版提供给开发者和企业用户。以下是基于最新技术规范的模型能力梳理。

一、基础参数与逻辑基准
Gemini 3.1 Pro 支持文本、图像、视频、音频及PDF等多模态输入。其上下文窗口的输入上限设定为 1,048,576 个 Token，输出上限为 65,536 个 Token。
在评估模型解决未知逻辑模式能力的 ARC-AGI-2 基准测试中，Gemini 3.1 Pro 的得分为 77.1%，是上一代 Gemini 3 Pro 对应成绩的两倍。

二、纯代码视觉与SVG动画生成
视觉生成逻辑的扩充是该版本的技术更新之一。Gemini 3.1 Pro 支持直接通过文本提示生成适用于 Web 环境的动画 SVG 文件。
与基于像素矩阵的光栅图像生成不同，该模型将视觉元素与动画轨迹转化为纯代码输出。这种生成方式具有两项客观特征：

无损缩放：输出的矢量图形支持任意比例缩放，能够适配不同分辨率屏幕而不损失清晰度。
轻量化：在呈现动态视觉效果时，其基于纯代码的结构使得文件体积显著小于常规的视频或 GIF 格式。
在工程侧，模型能够解析复杂的矢量路径并输出标准化的 XML/SVG 代码。这些代码经过结构化处理，支持直接嵌入前端网页项目，或导入专业的矢量绘图软件进行二次编辑与拆解。

三、智能体工作流与专属 API 节点
针对软件工程（SWE）任务，模型在 API 层面新增了名为 gemini-3.1-pro-preview-customtools 的独立端点。
该端点针对包含自定义工具调用（如 view_file、search_code）与 Bash 环境执行的自动化工作流进行了优化。在此机制下，模型在执行长周期代码任务前，能够输出包含架构规划与风险评估的完整链路方案。例如在处理数据库迁移指令时，模型会预先输出包含同步引擎与冲突解决策略的方案架构，随后再切入代码编写阶段。

四、分发渠道
目前，Gemini 3.1 Pro 预览版已部署至多个产品线。开发者与企业用户可通过 Google AI Studio、Vertex AI、Gemini Enterprise、Android Studio 以及 Google Antigravity 开发平台进行接入。在消费端，该模型向订阅了 Google AI Pro 和 Ultra 计划的 Gemini 应用程序及 NotebookLM 用户开放。

总结
Gemini 3.1 Pro 的技术迭代集中于代码维度的结构化输出与逻辑推理。纯代码驱动的 SVG 动画生成以及专属工具 API 的引入，体现了该模型在前端开发视觉资源生成和自动化代码工程规划场景中的技术设定。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送