Gemini 2.5 Computer Use (Preview)

Name: Gemini 2.5 Computer Use Preview (10-2025)
Price: 1.25 USD
Availability: InStock
Author: Google Deep Mind

多模态大模型Gemini Computer UseGemini 2.5

Gemini 2.5 Computer Use Preview (10-2025)

发布时间: 2025-10-07更新于: 2025-10-08 10:57:56428

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

128K

中文支持

不支持

推理能力

Gemini 2.5 Computer Use Preview (10-2025) 是由 Google Deep Mind 发布的 AI 模型，发布时间为 2025-10-07，定位为多模态大模型，上下文长度为 128K，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Gemini 2.5 Computer Use (Preview)

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

64K tokens

模型类型

多模态大模型

输入/输出模态

文本、图像 → 文本

发布时间

2025-10-07

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Gemini 2.5 Computer Use (Preview)

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://gemini.browserbase.com/

Gemini 2.5 Computer Use (Preview)

官方介绍与博客

官方论文

Introducing the Gemini 2.5 Computer Use model

DataLearnerAI博客

暂无介绍博客

Gemini 2.5 Computer Use (Preview)

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$1.25/ 1M	$10.00/ 1M
文本	上下文长度 > 200000	$2.50/ 1M	$15.00/ 1M

Gemini 2.5 Computer Use (Preview)

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Gemini 2.5 Computer Use (Preview)

发布机构

Google Deep Mind

查看发布机构详情

Gemini 2.5 Computer Use Preview (10-2025)

模型解读

概述

Gemini 2.5 Computer Use 是基于 Gemini 2.5 Pro 视觉理解与推理能力而构建的专用模型，面向通过浏览器等图形界面执行业务操作的智能体（agent）场景。该模型以 Preview 形式通过 Gemini API 在 Google AI Studio 与 Vertex AI 向开发者开放。

工作机理与能力

模型通过新的 computer_use 工具以循环（agent loop）方式运行：输入包含用户目标、当前界面截图与近期动作历史；模型输出为规范化的 UI 动作（如点击、输入、拖拽等）的函数调用，同时可能附带对高风险动作的确认请求。客户端负责执行动作并回传新截图与 URL，直至任务完成或中止。

当前模型主要针对浏览器环境进行了优化，并在移动端 UI 控制基准上显示出良好潜力；尚未针对桌面 OS 级控制进行优化。

技术规格（公开信息）

模型版本（API id）：gemini-2.5-computer-use-preview-10-2025
输入模态：文本、图像（截图）；输出模态：文本
上下文窗口：输入 128K tokens；最大输出 64K tokens

性能与评测

Google 公布的自测与第三方环境（如 Browserbase harness）显示，该模型在 Online-Mind2Web、WebVoyager 与 AndroidWorld 等多项网页/移动控制基准上达到领先准确率与较低时延。具体分数及方法学细节见官方博文与随附的评估说明。

访问与定价

模型以 API 方式提供（AI Studio/Vertex AI）。Vertex AI 定价页提供了 Gemini 2.5 Pro — Computer Use (Preview) 的令牌计费：当输入上下文 ≤200K tokens 与 >200K tokens 时，输入/输出分别采用不同单价；若无在该模型项下明确列出的“缓存计费（Cached Input）”，则不应填入缓存单价。

应用与限制

适合：跨站信息采集、表单自动化、网页流程/用例测试、在登录态下操作 UI 等。限制：Preview 阶段可能产生错误与安全风险；需在受控环境运行，并对高风险动作实施二次确认与审计。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送