Google Deep Mind Logo

Gemini CLI

通用Agent

Google开源的命令行AI,可以免费使用Google的Gemini模型!

发布时间: 2025-06-26

工具使用能力
支持
规划能力
支持
多 Agent 协作
支持
记忆能力
长期用户记忆

Agent 基本信息

AI Agent 分类

通用Agent

发布时间

2025-06-26

依赖基础模型
工具集成

网页浏览,计算器,MCP,大模型,Google Search

执行模式

ReAct

部署选项

本地部署

前端交互模式

命令行

开源和体验地址

开源许可
Apache 2.0 - 免费商用授权
源码地址
在线体验

价格与模态信息

定价模型

框架免费,模型按需付费

定价详情
免费
输入模态

Text,Files,Images,Video,Audio

输出模态

Text

发布机构

Agent 介绍

Google Gemini CLI 是一款开源的命令行界面(CLI)代理工具,旨在将 Google Gemini 模型的能力直接引入开发者的终端环境。该工具于 2025 年 6 月发布,专注于在开发者熟悉的 CLI 环境中,通过 AI 辅助编程、任务自动化和多模态功能来提升工作效率。

技术规格:

  • 运行环境: 需要 Node.js 20 或更高版本。
  • 身份验证:可使用个人 Google 账号进行身份验证,提供免费层级(最高 60 次模型请求/分钟,1000 次请求/天)。也可通过 Google AI Studio 或 Vertex AI 生成 API 密钥以获取更高级别的访问权限。
  • 核心模型: 由 Gemini 2.5 Pro 模型驱动,支持 100 万 token 的上下文窗口,便于高效处理大型代码库和复杂查询。
  • 集成能力:与 Gemini Code Assist 紧密集成,可通过 Visual Studio Code Insiders 通道使用。支持模型上下文协议(MCP),可连接外部工具和服务器。允许通过 GEMINI.md 文件自定义系统提示,适配个性化或团队配置。
  • 架构: 采用推理-执行(ReAct)循环架构,使其能够与内置工具或本地/远程 MCP 服务器交互,处理如修复错误、创建功能、提升测试覆盖率等复杂任务。
  • 许可: 采用 Apache 2.0 开源许可证,源代码托管于 GitHub。
  • 免费层级限制: 60 次请求/分钟,1000 次请求/天(使用个人 Google 账号时)。

主要功能:

  • 大型代码库支持: 能够查询和编辑超出 100 万 token 上下文窗口的代码库,适用于大型项目。
  • 多模态能力: 支持开发者根据 PDF 文件、草图等非代码输入生成应用程序。
  • 任务自动化: 可自动化 DevOps 任务,例如查询拉取请求、处理复杂变基操作、总结 Git 变更、创建迁移计划等。
  • 工具集成: 可连接 MCP 服务器以使用高级功能,例如利用 Imagen、Veo、Lyria 等模型生成媒体内容。
  • Google 搜索集成: 内置 Google 搜索工具,提供基于实时数据的可靠响应。
  • 多样化应用场景: 支持创建 Discord 机器人、自动化幻灯片制作、图像转换、PDF 整理、深度研究等多种任务。
  • 免费层级可用性: 提供包含 60 次请求/分钟和 1000 次请求/天的免费使用层级(需个人 Google 账号),并为更高用量提供付费层级选项。

社区反馈与采用情况:

  • 自 2025 年 6 月发布后,GitHub 仓库在 24 小时内即获得超过 25,800 星标,显示出较高的早期关注度。
  • 积极反馈:有开发者反馈该工具显著提升了工作效率,例如实现了无需自行编码即可基于研究论文构建功能,或通过 YouTube 教程链接快速完成项目搭建。其安装便捷性、与 Google 搜索的集成以及免费且支持 Windows 的特性受到部分用户肯定。Google 通过 GitHub 积极鼓励社区提交错误报告、功能建议和代码贡献。
  • 改进建议:部分用户反馈存在模型切换频率较高的情况。有观点认为与某些竞品(如 Claude Code)相比,在执行复杂任务时的自主性和实现能力稍逊,需要更多用户指导。有用户指出其交互风格偏向标准化。

获取与使用:

开发者可通过 Gemini CLI 的 GitHub 仓库获取安装指南和详细文档。主要步骤包括:

  1. 安装 Node.js 20 或更高版本。
  2. 运行 CLI 命令,使用个人 Google 账号或 API 密钥进行身份验证。
  3. 参考文档配置高级选项,如连接 MCP 服务器或设置自定义提示。

仓库同时提供故障排除指南和条款服务文档。

总结:
Google Gemini CLI 为偏好命令行环境的开发者提供了一个轻量级访问高级 AI 能力的工具。其核心优势在于集成了强大的 Gemini 2.5 Pro 模型、开源特性、对大型代码库的支持、多模态处理能力以及包含免费层级的访问策略。该工具主要定位于辅助编程、自动化任务及多样化内容生成。社区反馈总体积极,其开源模式也为未来的功能演进和问题改进提供了基础。

依赖基础模型

Ge

Gemini-2.5-Pro-Preview-06-05

查看详情

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新AI Agent及大模型资讯

DataLearnerAI WeChat