← 返回 Blog

Gemini CLI + MCP 协议实战:把你终端变成一个能读文件、跑命令、搜网页的 AI Agent,全程不花一分钱

"把终端当 AI 指挥中心" 这个思路,值得每一位开发者认真尝试。当别人还在浏览器里来回切换标签页时,你已经能用 Gemini CLI 在命令行直接读取代码文件、查询网络信息、运行测试脚本了 —— 这种操作体感上的差距,只有真正上手才能体会。

GeminiGemini CLI 实战指南

Gemini CLI 实战指南:把终端变成你的 AI 指挥中心

"把终端当 AI 指挥中心" 这个思路,值得每一位开发者认真尝试。当别人还在浏览器里来回切换标签页时,你已经能用 Gemini CLI 在命令行直接读取代码文件、查询网络信息、运行测试脚本了 —— 这种操作体感上的差距,只有真正上手才能体会。

谷歌为开发者打造的这套工具链,核心优势体现在两个方面:一是内置了读写文件、执行 shell 命令、联网搜索等基础操作能力;二是通过 MCP(模型上下文协议)能够灵活对接 GitHub、Google Workspace、Cloud Run 等服务,把 AI 从 "只会聊天的模型" 变成 "能调用官方资源解决实际问题的助手"。最令人心动的是,使用个人谷歌账号通过 OAuth 登录,每天可获得 1000 次免费请求(每分钟 60 次),零成本就能使用带有 1M token 上下文窗口的 Gemini 2.5 Pro 模型。

一、两行命令完成安装,关键细节不能忽略

Gemini CLI 的唯一前置要求是 Node.js 版本≥18,2026 年业界普遍推荐使用更稳定的 LTS 版本,如 20 + 或 v24 系列。

安装只需一行命令:

bash

运行

npm install -g @google/gemini-cli

官方 GitHub 仓库和文档中明确标注的包名就是@google/gemini-cli,安装完成后对应的命令是gemini,而非其他名称。

首次启动:

bash

运行

gemini

CLI 会引导你选择认证方式,强烈建议选择 "Sign in with Google" 通过 OAuth 授权,浏览器会自动弹出谷歌登录页面。一定要走 OAuth 流程获取免费套餐,而不是图省事只填写 API Key,两者的权益差距非常大:

表格

认证方式额度与权益适用场景
谷歌账号 OAuth(推荐)每分钟 60 次、每天 1000 次请求,使用 Gemini 2.5 Pro 模型,约 1M token 上下文窗口个人日常开发,免费额度充足
API Key(GEMINI_API_KEY)通常只能使用 Gemini 2.5 Flash 模型,约每分钟 10 次、每天 250 次请求Vertex/AI Studio 按量付费场景,个人免费额度较低

国内网络环境解决方案

在国内使用 Gemini CLI,需要确保终端流量能够稳定访问谷歌服务,否则第一步 OAuth 授权就无法完成。常见的解决方法有两种:

方法一:设置代理环境变量(推荐,粒度可控)

bash

运行

# macOS/Linux
export https_proxy=http://127.0.0.1:7890
export http_proxy=http://127.0.0.1:7890
gemini

# Windows PowerShell(端口请根据你的代理软件实际情况修改)
$env:https_proxy="http://127.0.0.1:7890"
$env:http_proxy="http://127.0.0.1:7890"
gemini

方法二:使用代理软件的 TUN 模式

让整机流量都走代理,终端无需单独配置。但需要确认 TUN 模式确实生效,且 DNS 没有泄漏。

二、四大内置工具箱:开箱即用的核心能力

安装完成后无需额外配置,就能使用以下核心能力。不需要背诵复杂的语法,直接用自然语言描述需求,Gemini CLI 会自动识别并调用对应的工具。

1. 读写文件:@符号快速引用

在对话中使用@文件名即可让 AI 自动读取文件内容并塞进上下文:

plaintext

@src/utils.ts 解释这段代码的缓存逻辑
@package.json 这个依赖树有没有明显冲突?

@路径不仅支持单个文件,也能展开目录,省去了你手动复制粘贴代码的繁琐步骤。配合编辑器相关偏好设置,可以形成 "AI 讨论↔本地文件修改" 的完整闭环,所有代码修改都发生在你的机器上,AI 只扮演参谋和执行者的角色。

2. 执行 Shell 命令:自动化处理文件操作

你可以直接用自然语言描述意图,让 AI 生成并执行对应的命令:

plaintext

删掉所有.test.js的构建缓存,先列出要删的清单让我确认,不要真删
找出所有包含FIXME注释的文件

它会自动完成 "理解目录结构→规划命令→执行预览" 的完整流程。底层支持文件读取、编辑、全局搜索、Shell 执行等多种操作。

⚠️ 重要提醒:第一次让 AI 执行 Shell 操作时,一定要先仔细查看它的执行计划和确认提示,绝对不要直接给全域删除等高危操作开绿灯。

3. 联网搜索增强:获取最新信息

这是 Gemini CLI 最有价值的内置能力之一。当遇到需要最新信息的问题时,它会自动决定是否进行联网搜索,搜索完成后会将结果融入回答,并附上引用来源供你核验:

plaintext

React 19最新特性有哪些?
Node 22中这个API的废弃替代方案是什么?

谷歌官方也将 "谷歌搜索接地" 作为 Gemini 工具链的核心卖点,对于版本更新、新 API 发布等时效性敏感的问题特别有用。

三、MCP 扩展:给 AI 装上 "外设"

如果说内置工具是 "出厂配置",那么 MCP(模型上下文协议)就是所有需要与外部世界交互的扩展槽。通过 MCP,你可以给 Gemini CLI 接入各种第三方服务,大幅扩展它的能力边界。

配置文件位于~/.gemini/settings.json(或项目级的.gemini/settings.json)的mcpServers块中。以下是接入 GitHub MCP 的示例(Docker 方式):

json

{
  "mcpServers": {
    "github": {
      "command": "docker",
      "args": [
        "-i", "--rm", "-e", "GITHUB_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_TOKEN": "ghp_你的GitHub令牌"
      }
    }
  }
}

重启 Gemini CLI 后,运行以下命令查看连接状态:

bash

运行

gemini
> /mcp list

如果看到github: Connected,就说明 AI 现在已经能够拉取 PR 列表、读取 Issue、管理代码仓库了。

目前社区和官方已经提供了丰富的 MCP 服务器,常见的扩展方向包括:

  • GitHub MCP:直接在终端查询和管理代码仓库
  • Google Workspace MCP:对接 Gmail、云端硬盘、日历,读取邮件、查阅文档、查看日程
  • Cloud Run/gcloud 系列:用自然语言部署和管理云资源
  • 本地项目索引:配合 GEMINI.md 文件,优化大型项目的理解效率

四、日常使用技巧:把 AI 当同事用

接手老仓库:先让 AI 做一次全面扫描

进入项目根目录运行 Gemini CLI,它会自动扫描项目结构,将理解到的技术栈、构建命令、测试方式等信息写入GEMINI.md文件。下次启动时会自动加载这些信息,不需要你每次重新介绍项目背景。

跨文件重构:用 1M 窗口 "兜住" 核心逻辑

1M token 上下文窗口的优势在于,中小型项目的核心文件群能够一次性全部加载,AI 可以跨文件追踪依赖关系,你只需要在关键节点进行人工审批即可。

时效性问题:主动触发联网搜索

当需要查询最新文档或避免使用过时写法时,可以在提示词中明确要求联网搜索并附上引用链接,让你的答案从 "模型训练截止日" 更新到 "今天"。

五、两个需要提前了解的现实

  1. 免费的 1000 次 / 天额度对于日常开发来说完全够用,但在 SWE-bench 级别的复杂多文件系统任务上,Gemini 2.5 Pro 的推理深度目前仍落后于 Claude Opus。它的优势在于免费、大窗口和谷歌生态集成,而非全方位碾压。
  2. 国内使用必须解决网络可达性问题,尤其是首次 OAuth 登录阶段对网络稳定性要求较高。但只要配置正确一次,后续使用会非常稳定。

务实结论

如果你日常工作以单文件编辑、脚本撰写、快速原型开发、代码库阅读为主,Gemini CLI 加 MCP 扩展已经能够覆盖市面上大部分 AI 编程工具的核心场景。将它和 Claude Code 按任务分层使用 ——Gemini 作为日常免费主力,Claude 用来攻克硬骨头,才是 2026 年最贴合实际的 AI 编程工作流。

对于希望获得更稳定、更便捷 AI 服务的开发者和企业用户来说,选择专业的 API 中转服务平台是一个理想的解决方案。UseAIAPI 提供包括 Gemini、Claude、ChatGPT、DeepSeek 在内的全球热门 AI 大模型一站式接入服务,无需复杂的账号注册和网络配置,一次配置即可灵活切换不同模型,满足各种开发和使用场景的需求。价格方面,平台推出最低至官方价格 50% 的专属优惠,能够大幅降低高强度内容生成、复杂推理任务的使用成本。对于企业用户,UseAIAPI 还提供专业的企业级定制化服务,包括专属节点部署、SLA 服务等级保障和 7×24 小时技术支持,为团队协作和生产环境使用提供全方位保障。