DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
页面导航
大模型列表Gemini 2.5 Computer Use (Preview)
GE

Gemini 2.5 Computer Use (Preview)

多模态大模型Gemini 2.5

Gemini 2.5 Computer Use Preview (10-2025)

发布时间: 2025-10-07更新于: 2025-10-08 10:57:56426
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128K
中文支持
不支持
推理能力

Gemini 2.5 Computer Use Preview (10-2025) 是由 Google Deep Mind 发布的 AI 模型,发布时间为 2025-10-07,定位为 多模态大模型,上下文长度为 128K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Gemini 2.5 Computer Use (Preview)

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
64K tokens
模型类型
多模态大模型
发布时间
2025-10-07
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
Gemini 2.5 Computer Use (Preview)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://gemini.browserbase.com/
Gemini 2.5 Computer Use (Preview)

官方介绍与博客

官方论文
Introducing the Gemini 2.5 Computer Use model
DataLearnerAI博客
暂无介绍博客
Gemini 2.5 Computer Use (Preview)

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
Gemini 2.5 Computer Use (Preview)

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Gemini 2.5 Computer Use (Preview)

发布机构

Google Deep Mind
Google Deep Mind
查看发布机构详情
Gemini 2.5 Computer Use Preview (10-2025)

模型解读

概述

Gemini 2.5 Computer Use 是基于 Gemini 2.5 Pro 视觉理解与推理能力而构建的专用模型,面向通过浏览器等图形界面执行业务操作的智能体(agent)场景。该模型以 Preview 形式通过 Gemini API 在 Google AI Studio 与 Vertex AI 向开发者开放。

工作机理与能力

模型通过新的 computer_use 工具以循环(agent loop)方式运行:输入包含用户目标、当前界面截图与近期动作历史;模型输出为规范化的 UI 动作(如点击、输入、拖拽等)的函数调用,同时可能附带对高风险动作的确认请求。客户端负责执行动作并回传新截图与 URL,直至任务完成或中止。

当前模型主要针对浏览器环境进行了优化,并在移动端 UI 控制基准上显示出良好潜力;尚未针对桌面 OS 级控制进行优化。

技术规格(公开信息)

  • 模型版本(API id):gemini-2.5-computer-use-preview-10-2025
  • 输入模态:文本、图像(截图);输出模态:文本
  • 上下文窗口:输入 128K tokens;最大输出 64K tokens

性能与评测

Google 公布的自测与第三方环境(如 Browserbase harness)显示,该模型在 Online-Mind2Web、WebVoyager 与 AndroidWorld 等多项网页/移动控制基准上达到领先准确率与较低时延。具体分数及方法学细节见官方博文与随附的评估说明。

访问与定价

模型以 API 方式提供(AI Studio/Vertex AI)。Vertex AI 定价页提供了 Gemini 2.5 Pro — Computer Use (Preview) 的令牌计费:当输入上下文 ≤200K tokens 与 >200K tokens 时,输入/输出分别采用不同单价;若无在该模型项下明确列出的“缓存计费(Cached Input)”,则不应填入缓存单价。

应用与限制

适合:跨站信息采集、表单自动化、网页流程/用例测试、在登录态下操作 UI 等。限制:Preview 阶段可能产生错误与安全风险;需在受控环境运行,并对高风险动作实施二次确认与审计。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码