← 返回 Blog

用 Gemini 3.1 Pro 的思考模式(Thinking Levels)做学术综述:Low/Medium/High 三级怎么选最省钱又够用?

Gemini 3.1 Pro 整体定价保持稳定,输入字符计费标准为每百万字符 2 单位,输出字符为每百万字符 12 单位。全新上线的thinkingLevel档位调节功能,分为 LOW、MEDIUM、HIGH 三档,系统默认启用最高档位 HIGH。对于学术创作、批量文献处理等场景而言,合理切换推理档位,是平衡内容质量与使用成本的关键。

Gemini巧用 Gemini 3.1 Pro 推理档位

巧用 Gemini 3.1 Pro 推理档位 优化学术综述创作 精准控制使用成本

撰写学术综述时,不少创作者都会遇到一个容易被忽视的问题:大模型并非输出内容就会产生开销,其后台漫长的内部思考过程同样会生成计费字符。不少用户花费高额成本,却只是为模型多余的深度推理买单。Gemini 3.1 Pro 推出三级推理档位调节功能,如同为算力装上可控旋钮,帮助使用者在保障文章质量的前提下,合理分配算力资源,让每一笔开销都发挥最大价值。

Gemini 3.1 Pro 整体定价保持稳定,输入字符计费标准为每百万字符 2 单位,输出字符为每百万字符 12 单位。全新上线的thinkingLevel档位调节功能,分为 LOW、MEDIUM、HIGH 三档,系统默认启用最高档位 HIGH。对于学术创作、批量文献处理等场景而言,合理切换推理档位,是平衡内容质量与使用成本的关键。

一、厘清计费逻辑:读懂推理字符的成本构成

很多使用者并不了解,模型运行过程中产生的思考字符(Thinking Tokens),大多按照输出标准计费,同时还会占用输出字符配额、影响响应速度。优化成本的核心,并非单纯缩减文章篇幅,而是按需管控模型的推理深度与思考时长。

需要注意,thinkingLevel仅支持传入字符串参数,不可使用数字标识。三档档位适配场景、推理深度与使用成本差异如下:

表格

档位适用场景推理深度成本等级
LOW文献批量相关性判定、格式整理、内容初筛推理浅显,偏向快速应答成本最低
MEDIUM主体内容撰写、观点归类、框架搭建、信息提炼推理深度适中,综合表现均衡中等,约为 HIGH 档位的 1/3 至 1/2
HIGH观点冲突校验、复杂逻辑关联分析、研究空白论证推理层级最深,思考链路更长成本最高

业内常用字符数值仅作为参考类比,实际生成字符数量会随任务类型动态变化。系统默认开启 HIGH 档位,若不手动设置,即便是简单任务,模型也会进行深度推理,造成不必要的成本浪费。

二、学术综述实战方案:分阶段切换档位 兼顾效率与成本

以整理 50 篇相关文献、完成垂直领域大模型应用综述初稿为例,按照文献处理、框架搭建、难点论证三个阶段切换推理档位,是兼顾性价比与文稿质量的最优方案。

阶段一:文献初筛与分类 选用 LOW 档位

本阶段目标是快速筛选文献,将 50 篇候选文献精简至核心阅读范围。依托 LOW 档位快速推理的特性,批量判断文献相关性,并输出标准化结构化数据,便于后续批量处理。

json

{
  "task": "relevance_check",
  "thinkingLevel": "LOW",
  "response_schema": {
    "type": "object",
    "properties": {
      "paper_id": {"type": "string"},
      "relevant": {"type": "boolean"},
      "reason": {"type": "string"}
    }
  }
}

该档位可以大幅降低海量文献初筛环节的推理成本。标准化的 JSON 输出格式,也便于后续通过脚本完成数据汇总,快速统计研究方向、技术方法、发表年份等维度信息。

阶段二:观点提炼与框架搭建 主力使用 MEDIUM 档位

经过初筛后,以留存的 30 篇核心文献为基础,提炼核心观点、研究方法与研究结论,搭建完整综述大纲。此环节选用 MEDIUM 档位,要求模型按照固定格式输出内容。

配置参考:

thinkingLevel: MEDIUM

输出要求:按照研究方向、方法论类别、核心结论进行结构化梳理,搭建综述框架;所有观点标注对应文献编号,内容存疑部分标注【待验证】。

MEDIUM 档位是学术写作的 “高性价比选择”,推理能力足以支撑内容归类、基础矛盾排查与大纲搭建工作,同时有效规避 HIGH 档位带来的高额开销。

阶段三:难点攻坚与冲突校验 局部启用 HIGH 档位

针对前文梳理出的争议观点、跨文献逻辑冲突、研究空白论证等重难点内容,无需全流程使用高推理档位,仅针对局部问题单独启用 HIGH 档位即可。

配置参考:

thinkingLevel: HIGH

使用方式:仅导入 2 至 5 篇核心文献的相关段落与待核验问题,要求模型给出可验证的判别依据,所有结论标注引用来源。

将高成本的深度推理,集中用于复杂逻辑研判环节,避免全流程启用高阶档位造成成本冗余,实现算力精准投放。

三、实用避坑指南 规避档位使用常见问题

结合长期实操经验,这里总结三项核心注意事项,帮助大家规范使用档位功能,减少故障与额外开销。

  1. 优化指令再启用高阶档位

    模糊、不明确的指令会让 HIGH 档位陷入无效循环推理,产生大量冗余计费字符。建议先用 MEDIUM 档位打磨指令逻辑,确保需求清晰收敛后,再局部切换至 HIGH 档位。

  2. 调用接口务必手动指定档位

    系统默认档位为 HIGH,若未主动配置参数,所有任务都会按照最高标准计费。正确配置示例:

    config = {"thinkingLevel": "MEDIUM"}

    再次提醒,参数必须填写字符串,禁止使用数字。

  3. 及时清理上下文 避免数据干扰

    高阶推理产生的运行状态会残留于会话中,影响后续 LOW 档位批处理任务。在切换任务类型、变更推理档位时,建议新建会话或清空上下文,保障任务稳定运行。

总结使用口诀:LOW 档位批量扫读文献,MEDIUM 档位搭建全文框架,HIGH 档位专攻难点问题。按需调节推理深度,才能让算力与成本发挥最大价值。

想要便捷调用 Gemini、Claude、ChatGPT、DeepSeek 等多款主流 AI 大模型开展学术创作、文献分析等工作,UseAIAPI是理想选择。平台接口运行稳定,适配各类批量任务、长文本创作场景,同时可根据团队、个人的使用需求提供定制化服务,简化接入流程。

在成本管控方面,平台推出专属优惠,全部模型 API 调用价格最低可至官方定价的 50%。灵活的计费模式,能够有效降低文献批量处理、长篇综述创作等高强度使用场景的开销,助力用户以更高性价比发挥 AI 工具的价