← 返回 Blog

官方没明说的潜规则:codegen 用 Medium、架构级 debug 才上 High、批量 lint 永远 Low——一套 prompt 模板让你省 60% 费用

Gemini 3.1 Pro 的thinkingLevel参数提供了 LOW、MEDIUM、HIGH 三个选项。大多数人潜意识里把它理解成 "蠢→正常→聪明" 的升级开关,觉得默认往高的选总没错 —— 但这根本不是聪明档位的切换。

GeminiGemini 3.1 ProGemini 3.1 Pro 三档思考系统

Gemini 3.1 Pro 三档思考系统:不是越聪明越贵,错档才会让你付两份钱

Gemini 3.1 Pro 的thinkingLevel参数提供了 LOW、MEDIUM、HIGH 三个选项。大多数人潜意识里把它理解成 "蠢→正常→聪明" 的升级开关,觉得默认往高的选总没错 —— 但这根本不是聪明档位的切换。

如果你把 LOW/MEDIUM/HIGH 当作 "低配 / 标配 / 高配" 来用,那你已经给模型付了两笔不该付的钱:一笔在账单上,一笔在无休止的重做里。下面三张 "使用姿态卡片",帮你彻底掰正这个概念。

一、三档的真实身份:不是 "蠢 / 正常 / 聪明"

🔹 LOW:最低延迟,最快执行器

模型几乎跳过所有思考过程,直接执行明确的简单指令。

  • 适用场景:纯文本翻译、结构化数据提取、文本分类、批量格式修复(lint/format fix)、单行代码修整、千文件级批量 lint 检查
  • Token 逻辑:思考链≈0 或极小,输出 token 压到最低
  • 一句话总结:任务边界清晰、不需要任何推理 —— 用 LOW。千文件级 format 修复的总价可控制在约 5 美元量级

LOW 不是 "阉割版的聪明"—— 它是专门为简单任务设计的毫秒级执行器。你让它按模板走,它就不该花哪怕 1 个思考 token 去 "理解为什么要这么做"。

🔸 MEDIUM ★:3.1 Pro 的真正主角

3.1 Pro 的 MEDIUM 档≈旧版 Gemini 3 Pro 的 HIGH 档,但思考时间更短、token 开销更低。它能覆盖日常 80% 以上的工作(函数实现、代码审查、文档撰写、单元测试生成),质量感知完全不下降,账单却比 HIGH 档节省 60% 以上。

它就是那个 "绝大多数时候你该停在的档位"。

🔺 HIGH:不是你认识的那个 HIGH—— 它是 Deep Think Mini

3.1 Pro 的 HIGH 档被重新定义为深度多步推理专用模式,只在以下场景值得开启:

  • 跨文件架构设计
  • 复杂逻辑调试(多步归因)
  • 多步规划 / 长代码链推理
  • 安全深层扫描 / Agent 工具链编排

对普通代码生成任务用 HIGH,就像用牛刀杀鸡 —— 思考 token 消耗量可能是实际输出内容的几倍。因为 Gemini 的思考 token 按输出单价计费(≤200K 时 12 美元 / 百万 token,>200K 时 18 美元 / 百万 token),一个跨文件 debug 可能花 4000 个思考 token 去写 500 个 token 的答案,最终你要为 4500 个 token 买单。

二、没人告诉你的日常任务档位速查表(直接贴显示器)

日常代码迭代根本不需要把档位全开。对照你自己的任务,直接对号入座:

表格

任务类型推荐档位核心理由与示例
批量格式修复 /lint、单行 bug 修复、测试文件生成、添加注释LOW几乎不需要推理,毫秒级响应;千文件 lint≈5 美元;继续用 MEDIUM 会白白翻倍甚至更多输出 token
函数实现、单元测试编写、单文件代码审查、代码风格规范化MEDIUM ★覆盖 80% 以上日常工作,是速度与质量的最佳切割点,token 消耗只有 HIGH 的一半;MEDIUM 的质量≈旧版 3 Pro 的 HIGH 档
跨文件重构、系统架构设计、多步调试、安全深层扫描、Agent 编排HIGH启动 Deep Think Mini 模式,会消耗大量 token(4000 个思考 / 500 个输出),只在复杂项目规划阶段开启
浅逻辑单文件 bug 定位MEDIUM→HIGH先用 MEDIUM 定位根因,发现涉及跨文件依赖或状态链时再切 HIGH;别上来就用 HIGH——80% 的情况 MEDIUM 先分析就够了
全栈功能开发(前端→后端→测试)HIGH→MEDIUM用 HIGH 做全栈架构和模块划分规划,确认方案后切回 MEDIUM 跑具体实现,避免整条开发链被烧成几万输出 token

三、三个直接能用的省钱 Prompt 模板

核心原则:档位管深度,Prompt 管边界。两者一起卡死,token 才不会偷偷膨胀。

① 批量 Lint / 格式化场景 —— 锁死 LOW

plaintext

你是代码格式化助手。收到代码文件内容后,
只按ESLint --fix的风格做自动修复:
  ✅ 仅修改格式
  ❌ 不加任何注释
  ❌ 不生成额外说明文字
  ❌ 不解释修复原因
  ❌ 不改任何业务逻辑

【代码】

这句话把任务范围焊死了,批量场景下 token 消耗从 "几千" 直接压到 "几百"。

② 代码生成场景 —— 默认 MEDIUM

plaintext

实现:[具体功能描述]
输出要求:
  - 只给修改后的代码片段
  - 准确标出变更文件名和行号范围
  - 不解释实现原理、不给备选方案
  - 保持原有代码风格,只保留必要的注释

MEDIUM 默认就能输出高质量的完整代码,不需要 HIGH 档的 "反复自检" 在后台烧 token。

③ 架构调试场景 ——HIGH 只盖核心步骤,然后切回 MEDIUM 执行

plaintext

Phase 1(使用HIGH档):
分析当前代码仓库结构,定位[某问题]的潜在根因。
输出一个Step Plan(≤2000字符),结构必须是:
  "先查模块A → 验证B调用链 → 最终定位C入口"

Phase 2(切换到MEDIUM档):
按Step Plan逐项修改代码,每改完一个文件只给变更diff,不输出完整文件内容。

这种拆分方式比全程用 HIGH 节省约 50% 的 token,但解题的逻辑完整性完全不受影响。

四、真实场景计费:档位选对,月账单从 108 美元降到 40 美元

以一个普通开发者每天 300 次 API 调用(混合任务类型)为例:

表格

策略构成说明月均账单
❌ 全默认 HIGH每次调用都带重思考链,平均约 1000 个输出 token / 次≈108 美元 / 月(大量低档任务在烧不该烧的思考 token)
✅ 分级路由LOW 承接 50%(150 次批处理)・MEDIUM 承接 40%(120 次日常)・HIGH 仅 10%(30 次复杂任务)≈40 美元 / 月(节省 60% 以上)

不是 Gemini 变贵了,是你的档位一直挂错了。写 Prompt 前先问自己一句:

"我这个活,真的需要模型花几千个 token 去想吗?"

想要第一时间体验 Gemini 3.1 Pro 的极致性价比,以及 Claude、GPT、DeepSeek 等全球主流 AI 大模型的最新特性?UseAIAPI为广大企业和开发者提供一站式稳定接入服务。平台全面覆盖全球热门 AI 大模型 API 接口,无需繁琐配置即可快速上手,同时还可根据企业个性化需求提供定制化解决方案,全程保障服务的稳定性与安全性。

在成本方面,UseAIAPI 推出了极具竞争力的专属优惠政策,所有模型 API 调用最低可享官方价格 5 折优惠。无论是独立开发者的日常编码需求,还是企业级的大规模 AI 应用部署,都能大幅降低算力成本,让你在灵活使用不同档位推理能力时不再有预算顾虑,能够全身心投入到核心业务创新中。