← 返回 Blog

别再只会在网页聊天框里写代码了:用 Gemini 3.1 Pro API 搭你自己的编码 Agent,1M 上下文吃下整个 Repo

如果你还在往谷歌 AI Studio 的 Gemini 3.1 Pro 网页框里复制粘贴代码,让它改一个函数,再把结果复制回来,然后问 "下一个呢"—— 那你其实是在用一辆百万美元的超跑送快递。

GeminiGemini 3.1 Pro

被网页聊天框困住的开发者们

如果你还在往谷歌 AI Studio 的 Gemini 3.1 Pro 网页框里复制粘贴代码,让它改一个函数,再把结果复制回来,然后问 "下一个呢"—— 那你其实是在用一辆百万美元的超跑送快递。

这件事很好理解。网页聊天框的幻觉太强了:打几个字,屏幕下方弹出一段代码,你复制、保存、运行。这个过程舒服,零门槛。但它最大的毒性在于:它悄悄把你的工作量从零放大到无限。每改一个文件都要手动粘贴上下文,AI 问你 "下一个文件是啥",你又得去粘 —— 几个小时泡在复制粘贴的泥沼里。直到有一天你要面对一次中型代码库的跨文件重构,你突然意识到:你只是在 "假装在用 AI",实际上你不过是它的提示词搬运工。

更讽刺的是,Gemini 3.1 Pro 恰恰是最适合砸碎这堵墙的模型 ——100 万 Token 上下文窗口,官方定价仅需 2 美元 / 百万输入 Token。你完全可以把它做成 "一次性读完整个项目" 的智能助手,像人一样从项目根目录出发,带着全局视角去修改代码。

一、把 "100 万 Token" 这件事想透

说实话,很多人一直把 "100 万 token 上下文" 当营销数字看待。但当你真的把它用作编码 Agent 的时候,这个数字的含义变得异常具体:

表格

项目规模大约 Token 数能否装进 1M 窗口
中型 Python 后端服务,3 万行代码8–10 万 tokens✅ 整个塞进去
纯前端 TypeScript 项目,4 万行代码12–15 万 tokens✅ 刚好够
同技术栈统一微服务仓库(5 个 Go 服务,共 8 万行)20–30 万 tokens✅ 扫三次全覆盖

这意味着 —— 你不再需要 "给 AI 喂文件" 了。不用手动粘贴auth_service.py进去,等 AI 改完再粘user_control.py。Gemini 可以直接看到项目的完整依赖网络。

微软安全响应中心(MSRC)的工程师已经跑通了这个方案:用 Gemini 3.1 Pro 对一套 15 万 Token 的 TypeScript 金融科技后端做仓库级安全审查 —— 单次扫描全仓库的输入成本约 0.40 美元,加上 Medium 档思考链 token,总成本仅 0.50–0.60 美元。

但必须提醒:不是所有场景都值得上 100 万 Token。如果你的项目总 token 不到 5 万,没必要硬撑满窗口让成本翻倍。代码审查时只盯最关键的热点文件,远比 "全仓库扫描洪水式输入" 高效。官方最佳实践:先筛选出近 3 个月变更最频繁的 10–20 个文件,再补上复杂度最高的前 5 个模块 —— 精准输入比大水漫灌节省 60% 以上的成本。

二、用 API 搭一个能 "自己读代码" 的 Agent

把 Gemini API 从 "简单代码生成器" 升级成真正的 Agent,本质上就是给它装上工具调用能力。目前三条最成熟的实战路径:

方案①:Gemini CLI(开箱即用,新手首选)⭐

谷歌官方已开源 Gemini CLI,这是一个在终端里原生运行的 AI Agent—— 能读取本地文件、执行 shell 命令、在授权后修改代码。

bash

运行

# 全局安装(推荐)
npm install -g @google/gemini-cli

# 进入项目根目录,直接开工
cd your-project
gemini "把这个项目的数据库连接层重构为连接池模式"

Gemini CLI 会从项目根目录自动扫描仓库结构,走 "规划→修改→验证" 的工具调用循环,你全程只需要做最终验收。官方基准测试显示,Gemini 3.1 Pro Preview 运行 Nuxt 项目任务的成功率约 88%,耗时约 345 秒,与 Claude Opus 4.7 处于同一水平。

顺带一提:免费层级使用个人谷歌账号登录,有 60 次 / 分钟、1000 次 / 天的额度限制。自动化场景建议改用 AI Studio 生成的 API 密钥或 Vertex AI 服务账号。

方案②:Python SDK + 自定义工具(中间层,灵活性最强)

当你不想被 CLI 绑死、需要把编码 Agent 嵌入 CI/CD 或自研 IDE 插件时,Python 原生 SDK 是最直接的选择:

python

运行

from google import genai
from google.genai import types

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_content(
    model="gemini-3.1-pro-preview",
    contents="分析当前目录下所有Python文件的import依赖关系",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(
            thinking_level="MEDIUM"
        )
    ),
)
print(response.text)

⚠️ 注意版本迁移:旧版google.generativeaigenai.configure(api_key=...)+GenerativeModel(...)写法正在被新版google.genai.Client()体系取代。新体系中工具调用、thinking_level等功能都通过types.GenerateContentConfigtypes.ThinkingConfig进行配置。

进阶玩法:接入 sagent 框架(PyPI 上的 sagent 0.1.6,Apache 2 协议的 Python 优先编码 Agent 运行时),它把原本需要从零搭建的会话管理、工具调用编排、多 Agent 协作全部封装成了可直接导入的 Python 对象:

python

运行

from sagent import tools
from sagent.agent import Agent
from sagent.providers import Google

agent = Agent(
    model=Google.from_env().model("gemini-3.1-pro-preview"),
    system="You are a senior code reviewer.",
    tools=[tools.Read(), tools.Glob(), tools.Grep()],
)
result = await agent.run("列出controller/目录下所有函数")

实测半小时内就能从零搭建出一个带 CLI 界面的编码 Agent 原型。

方案③:Cursor + OpenAI 兼容层(如果你不想换 IDE)

不想改动现有开发环境?通过 OpenAI 兼容层把 Gemini 3.1 Pro API 接入,直接配置成 Cursor 的模型提供商。这样你既保留了 Cursor 自带的多模型切换面板,又能享受到 Gemini 100 万 token 上下文的仓库级理解能力。

选哪条路?看你的舒适区:想省事就学 CLI,想深度定制就走 SDK。

三、写 Agent 时最容易 "自作聪明" 的三个坑

代码能跑、Agent 能动了 ≠ 真的在帮你省钱。三个最容易踩的坑:

坑①:thinking_level 设太高 = token 焚烧炉

Gemini 3.1 Pro 的三档思考深度(Low/Medium/High)不是摆设:

表格

档位什么时候用代价
LOW(毫秒级)日常补全、简单翻译、短文本生成输出 token 消耗降低 80% 以上
MEDIUM(1–3 秒)代码审查、中等修改、常规分析⭐ 绝大多数任务的甜点档
HIGH(深度推理)数学证明、架构级跨模块安全审计后台消耗大量思考 token,按输出单价计费

默认不显式设置时容易跑在高开销路径上 —— 简单翻译也可能触发深层思考链,导致账单翻十几倍。解法:采用动态策略 —— 补全用 LOW,修改用 MEDIUM,只在涉及跨文件安全或架构调整时才切换到 HIGH。

坑②:"把一切全塞 Prompt" 是顶级反面模式

直接把整个源码文件夹倒进 Prompt 敲一句 "review this",Gemini 会试图逐行点评,但抓不住任何实质性问题。有效做法是:让 Agent 先建立目录树索引 → 从 100 多个文件中裁剪出风险最高的 10 个核心模块 → 再喂给 Gemini,并用约束块明确指示 "只报告有证据支撑的结论,不输出虚构问题"。这种做法实测能把无关输出压缩约 60%。

坑③:Token 计费不是均匀分布的 —— 超过 20 万那条线就翻倍

这是最阴险的一条:

表格

上下文长度输入价格(百万 token)输出价格(百万 token)
≤200K tokens2 美元12 美元
>200K tokens4 美元18 美元

意思是:如果你的仓库上下文控制在 180K tokens,花费还算温柔;但如果你硬塞了 350K,多出来的 150K 就会触发高阶费率,单次输入成本从 0.40 美元跳到 0.70 美元。写 Agent 时必须精确核算每次对话的 token 消耗,不能拍脑袋。

四、低成本编程 Agent = 1M 上下文 × $2 / 百万 Token × 有效裁剪

很多人觉得 API Agent 开发太复杂,总觉得要写几千行调度逻辑、上 LangGraph、搞状态机。其实 Gemini 3.1 Pro 已经把门槛压得非常低 —— 它有原生工具调用能力,能一次性调用多个工具、自动编排依赖关系。你只需要写一个简单的工具声明,Gemini 会自己决定调用哪个工具、传什么参数,然后解析返回结果继续推理。你不需要重型 Agent 框架,离一个能跑的编程 Agent 可能就 100 行 Python 代码。

用 Gemini CLI 彻底告别复制粘贴模式,用 Python SDK 做到全自动编排集成,用 100 万 token 上下文替换掉 "一次喂一个文件" 的低效流水线 —— 当你的 AI 助手能一次性读完整个仓库结构、自动修改多文件间的依赖引用、理解散落在不同目录的业务逻辑碎片时,它才算是真正开始替你写代码。

而不是帮你粘贴代码。

想要第一时间体验 Gemini 3.1 Pro 的强大编码能力,以及 Claude、GPT、DeepSeek 等全球主流 AI 大模型的最新特性?UseAIAPI为广大企业和开发者提供一站式稳定接入服务。平台全面覆盖全球热门 AI 大模型 API 接口,无需繁琐配置即可快速上手,同时还可根据企业个性化需求提供定制化解决方案,全程保障服务的稳定性与安全性。

在成本方面,UseAIAPI 推出了极具竞争力的专属优惠政策,所有模型 API 调用最低可享官方价格 5 折优惠,大幅降低企业在高强度代码生成、全仓库安全审查、多 Agent 系统开发等场景下的算力成本,让你无需为高昂的 AI 使用费用担忧,能够全身心投入到核心业务创新中。