Gemini CLI 实战指南：把终端变成你的 AI 指挥中心

"把终端当 AI 指挥中心" 这个思路，值得每一位开发者认真尝试。当别人还在浏览器里来回切换标签页时，你已经能用 Gemini CLI 在命令行直接读取代码文件、查询网络信息、运行测试脚本了 —— 这种操作体感上的差距，只有真正上手才能体会。

谷歌为开发者打造的这套工具链，核心优势体现在两个方面：一是内置了读写文件、执行 shell 命令、联网搜索等基础操作能力；二是通过 MCP（模型上下文协议）能够灵活对接 GitHub、Google Workspace、Cloud Run 等服务，把 AI 从 "只会聊天的模型" 变成 "能调用官方资源解决实际问题的助手"。最令人心动的是，使用个人谷歌账号通过 OAuth 登录，每天可获得 1000 次免费请求（每分钟 60 次），零成本就能使用带有 1M token 上下文窗口的 Gemini 2.5 Pro 模型。

一、两行命令完成安装，关键细节不能忽略

Gemini CLI 的唯一前置要求是 Node.js 版本≥18，2026 年业界普遍推荐使用更稳定的 LTS 版本，如 20 + 或 v24 系列。

安装只需一行命令：

bash

运行

npm install -g @google/gemini-cli

官方 GitHub 仓库和文档中明确标注的包名就是@google/gemini-cli，安装完成后对应的命令是gemini，而非其他名称。

首次启动：

bash

运行

gemini

CLI 会引导你选择认证方式，强烈建议选择 "Sign in with Google" 通过 OAuth 授权，浏览器会自动弹出谷歌登录页面。一定要走 OAuth 流程获取免费套餐，而不是图省事只填写 API Key，两者的权益差距非常大：

表格

认证方式	额度与权益	适用场景
谷歌账号 OAuth（推荐）	每分钟 60 次、每天 1000 次请求，使用 Gemini 2.5 Pro 模型，约 1M token 上下文窗口	个人日常开发，免费额度充足
API Key（GEMINI_API_KEY）	通常只能使用 Gemini 2.5 Flash 模型，约每分钟 10 次、每天 250 次请求	Vertex/AI Studio 按量付费场景，个人免费额度较低

国内网络环境解决方案

在国内使用 Gemini CLI，需要确保终端流量能够稳定访问谷歌服务，否则第一步 OAuth 授权就无法完成。常见的解决方法有两种：

方法一：设置代理环境变量（推荐，粒度可控）

bash

运行

# macOS/Linux
export https_proxy=http://127.0.0.1:7890
export http_proxy=http://127.0.0.1:7890
gemini

# Windows PowerShell（端口请根据你的代理软件实际情况修改）
$env:https_proxy="http://127.0.0.1:7890"
$env:http_proxy="http://127.0.0.1:7890"
gemini

方法二：使用代理软件的 TUN 模式

让整机流量都走代理，终端无需单独配置。但需要确认 TUN 模式确实生效，且 DNS 没有泄漏。

二、四大内置工具箱：开箱即用的核心能力

安装完成后无需额外配置，就能使用以下核心能力。不需要背诵复杂的语法，直接用自然语言描述需求，Gemini CLI 会自动识别并调用对应的工具。

1. 读写文件：@符号快速引用

在对话中使用@文件名即可让 AI 自动读取文件内容并塞进上下文：

plaintext

@src/utils.ts 解释这段代码的缓存逻辑
@package.json 这个依赖树有没有明显冲突？

@路径不仅支持单个文件，也能展开目录，省去了你手动复制粘贴代码的繁琐步骤。配合编辑器相关偏好设置，可以形成 "AI 讨论↔本地文件修改" 的完整闭环，所有代码修改都发生在你的机器上，AI 只扮演参谋和执行者的角色。

2. 执行 Shell 命令：自动化处理文件操作

你可以直接用自然语言描述意图，让 AI 生成并执行对应的命令：

plaintext

删掉所有.test.js的构建缓存，先列出要删的清单让我确认，不要真删
找出所有包含FIXME注释的文件

它会自动完成 "理解目录结构→规划命令→执行预览" 的完整流程。底层支持文件读取、编辑、全局搜索、Shell 执行等多种操作。

⚠️ 重要提醒：第一次让 AI 执行 Shell 操作时，一定要先仔细查看它的执行计划和确认提示，绝对不要直接给全域删除等高危操作开绿灯。

3. 联网搜索增强：获取最新信息

这是 Gemini CLI 最有价值的内置能力之一。当遇到需要最新信息的问题时，它会自动决定是否进行联网搜索，搜索完成后会将结果融入回答，并附上引用来源供你核验：

plaintext

React 19最新特性有哪些？
Node 22中这个API的废弃替代方案是什么？

谷歌官方也将 "谷歌搜索接地" 作为 Gemini 工具链的核心卖点，对于版本更新、新 API 发布等时效性敏感的问题特别有用。

三、MCP 扩展：给 AI 装上 "外设"

如果说内置工具是 "出厂配置"，那么 MCP（模型上下文协议）就是所有需要与外部世界交互的扩展槽。通过 MCP，你可以给 Gemini CLI 接入各种第三方服务，大幅扩展它的能力边界。

配置文件位于~/.gemini/settings.json（或项目级的.gemini/settings.json）的mcpServers块中。以下是接入 GitHub MCP 的示例（Docker 方式）：

json

{
  "mcpServers": {
    "github": {
      "command": "docker",
      "args": [
        "-i", "--rm", "-e", "GITHUB_TOKEN",
        "ghcr.io/github/github-mcp-server"
      ],
      "env": {
        "GITHUB_TOKEN": "ghp_你的GitHub令牌"
      }
    }
  }
}

重启 Gemini CLI 后，运行以下命令查看连接状态：

bash

运行

gemini
> /mcp list

如果看到github: Connected，就说明 AI 现在已经能够拉取 PR 列表、读取 Issue、管理代码仓库了。

目前社区和官方已经提供了丰富的 MCP 服务器，常见的扩展方向包括：

GitHub MCP：直接在终端查询和管理代码仓库
Google Workspace MCP：对接 Gmail、云端硬盘、日历，读取邮件、查阅文档、查看日程
Cloud Run/gcloud 系列：用自然语言部署和管理云资源
本地项目索引：配合 GEMINI.md 文件，优化大型项目的理解效率

四、日常使用技巧：把 AI 当同事用

接手老仓库：先让 AI 做一次全面扫描

进入项目根目录运行 Gemini CLI，它会自动扫描项目结构，将理解到的技术栈、构建命令、测试方式等信息写入GEMINI.md文件。下次启动时会自动加载这些信息，不需要你每次重新介绍项目背景。

跨文件重构：用 1M 窗口 "兜住" 核心逻辑

1M token 上下文窗口的优势在于，中小型项目的核心文件群能够一次性全部加载，AI 可以跨文件追踪依赖关系，你只需要在关键节点进行人工审批即可。

时效性问题：主动触发联网搜索

当需要查询最新文档或避免使用过时写法时，可以在提示词中明确要求联网搜索并附上引用链接，让你的答案从 "模型训练截止日" 更新到 "今天"。

五、两个需要提前了解的现实

免费的 1000 次 / 天额度对于日常开发来说完全够用，但在 SWE-bench 级别的复杂多文件系统任务上，Gemini 2.5 Pro 的推理深度目前仍落后于 Claude Opus。它的优势在于免费、大窗口和谷歌生态集成，而非全方位碾压。
国内使用必须解决网络可达性问题，尤其是首次 OAuth 登录阶段对网络稳定性要求较高。但只要配置正确一次，后续使用会非常稳定。

务实结论

如果你日常工作以单文件编辑、脚本撰写、快速原型开发、代码库阅读为主，Gemini CLI 加 MCP 扩展已经能够覆盖市面上大部分 AI 编程工具的核心场景。将它和 Claude Code 按任务分层使用 ——Gemini 作为日常免费主力，Claude 用来攻克硬骨头，才是 2026 年最贴合实际的 AI 编程工作流。

对于希望获得更稳定、更便捷 AI 服务的开发者和企业用户来说，选择专业的 API 中转服务平台是一个理想的解决方案。UseAIAPI 提供包括 Gemini、Claude、ChatGPT、DeepSeek 在内的全球热门 AI 大模型一站式接入服务，无需复杂的账号注册和网络配置，一次配置即可灵活切换不同模型，满足各种开发和使用场景的需求。价格方面，平台推出最低至官方价格 50% 的专属优惠，能够大幅降低高强度内容生成、复杂推理任务的使用成本。对于企业用户，UseAIAPI 还提供专业的企业级定制化服务，包括专属节点部署、SLA 服务等级保障和 7×24 小时技术支持，为团队协作和生产环境使用提供全方位保障。