← 返回 Blog

Gemini API 现在能跑「自治智能体」了——Managed Agents 从创建到执行全流程(Python):隔离环境·工具调用·文件读写·拿回结果

在 2026 年 5 月举行的 Google I/O 开发者大会上,最被业界低估的重磅发布,既不是 Gemini 3.5 Flash 的性能提升,也不是谷歌搜索的 AI 化转型,而是一项能够改变 AI 开发范式的底层能力 ——Gemini API 托管智能体(Managed Agents)。

GeminiGemini API 推出托管智能体功能

Gemini API 推出托管智能体功能 开启 AI 应用开发新范式

在 2026 年 5 月举行的 Google I/O 开发者大会上,最被业界低估的重磅发布,既不是 Gemini 3.5 Flash 的性能提升,也不是谷歌搜索的 AI 化转型,而是一项能够改变 AI 开发范式的底层能力 ——Gemini API 托管智能体(Managed Agents)。

"托管智能体" 这个名称听起来平平无奇,但其本质是谷歌将搭建、运行、维护自主 AI 智能体所需的所有繁琐底层工作,包括编排逻辑、沙箱容器、会话状态持久化、工具调用并发安全等,全部打包成了一行 API 调用。开发者不再需要自行编写复杂的编排代码、折腾沙箱环境、管理会话状态或处理并发冲突。谷歌这次相当于把 Claude Code 级别的智能体运行时,做成了任何 Python 项目都能直接调用的标准化云服务。

一、环境准备与 SDK 安装

使用前请先前往 Google AI Studio(https://aistudio.google.com)获取 Gemini API 密钥。预览阶段的环境算力资源免费,仅按 Gemini 3.5 Flash 标准费率收取 Token 和工具调用费用。

安装 Python SDK:

bash

运行

pip install google-genai

初始化客户端(强烈建议通过环境变量传入密钥,请勿硬编码在代码中):

python

运行

import os
from google import genai

client = genai.Client(
    api_key=os.environ.get("GEMINI_API_KEY")
)

二、一行代码创建并运行智能体

本次更新最具颠覆性的一点是:开发者无需提前进行任何配置注册,智能体的行为可以直接在调用时内联定义,实现无状态、无配置文件、随起随停的灵活调用。

python

运行

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",  # 2026年5月预览版底层框架
    input="读取Hacker News首页,抓取前10条标题,保存为summary.txt文件",
    environment="remote"  # 运行在谷歌云隔离沙箱中
)

这行简单代码的背后,谷歌在云端自动完成了一系列复杂操作:

  • 为本次任务拉起一个独立的 Linux 隔离沙箱
  • 启动 Antigravity 智能体框架,底层由 Gemini 3.5 Flash 驱动
  • 自动调用内置工具完成网页搜索、内容爬取和文件写入
  • 自动维护会话状态,支持多轮交互和任务断点恢复
  • 自主执行多步推理循环:任务规划→工具调用→结果校验→迭代修正,直到目标达成或主动终止

沙箱的持久化特性让多轮交互无缝衔接。通过保存返回的interaction.id,开发者可以随时恢复之前的会话,沙箱内的文件和上下文将完整保留,无需担心会话中断或上下文丢失。获取任务结果同样只需一行代码:

python

运行

result = client.interactions.get_result(interaction.id)
print(result.content[0].text)

三、智能体定制化:三级梯度满足不同场景需求

默认的 Antigravity 智能体是一个具备通用能力的基础模型,要将其应用于生产级场景,开发者需要为其定义明确的角色和边界。谷歌提供了三级定制化梯度,覆盖从快速原型验证到大规模生产部署的全流程需求。

1. 内联配置(适用于快速原型验证)

调用时直接传入系统指令和工具白名单,用完即走,无需提前注册,最适合快速验证想法:

python

运行

interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="分析这个CSV文件,输出销售趋势摘要",
    system_instructions="你是专业数据分析师,所有结果必须用Markdown表格呈现",
    # 重要提示:所有涉及外部网络的工具必须显式加入白名单,沙箱默认关闭对外访问权限
    tools=["code_execution", "file_management", "google_search"]
)

2. 配置文件驱动(适用于团队日常协作)

在项目根目录创建AGENTS.mdSKILL.md两个 Markdown 文件,支持 Git 版本跟踪,便于团队协作和版本管理:

  • AGENTS.md:定义智能体的系统角色、全局工作流和禁忌边界
  • SKILL.md:定义具体技能点和技术约束

示例SKILL.md

markdown

# SKILL.md
## 技能:Flask API开发
- 技术栈:Flask + SQLAlchemy
- 约束条件:所有路由必须包含错误处理和输入校验
- 输出要求:统一返回JSON格式响应,必须包含success状态字段

3. 预注册命名智能体(适用于生产环境)

当配置稳定后,可以通过注册接口将其保存为模板,后续直接通过 ID 调用,确保行为一致性和可管控性:

python

运行

# 注册一次,永久使用
agent_config = client.agents.register(
    name="my-data-analyzer",
    system_instructions="你是专业数据分析师,所有结果必须用Markdown表格呈现",
    tools_config=["code_execution", "google_search", "file_management"]
)

# 后续直接通过ID调用
interaction = client.interactions.create(
    agent=agent_config.id,
    input="拉取最新的销售报表并生成分析摘要",
    environment="remote"
)

四、开箱即用的工具链与安全机制

Gemini 托管智能体提供了丰富的官方内置工具,所有涉及外部网络的操作都必须显式申明权限,确保安全可控:

表格

工具分类具体能力权限要求
代码执行在沙箱内自由运行 Python/Bash 脚本,支持后台进程和交互式会话沙箱隔离,不影响宿主机
文件系统支持文件读写、精确替换、目录列表等操作仅限沙箱内部目录
互联网搜索集成谷歌搜索,获取实时最新信息必须显式将 "google_search" 加入工具白名单,默认关闭
网页爬取读取任意 URL 内容,支持 HTML 解析需配合搜索工具或显式 URL 白名单
批量文件处理一键读取多个文件并整合进上下文无额外权限要求
任务状态跟踪智能体内部自动生成待办清单,自主校验任务进度框架内置

安全机制方面,所有文件修改和 Shell 命令执行都在隔离沙箱中进行,不会污染开发者的本地环境。对于高风险操作,还可以配置手动确认弹窗,进一步提升安全性。

五、成本优化:注意隐藏的 Token 消耗

预览阶段的沙箱算力(CPU、内存、运行时)完全免费,仅收取 Token 和工具调用费用。但有一个极易被忽略的成本陷阱:

Antigravity 智能体不是 "一次推理就结束" 的普通 API 调用,它会自主运行多步循环。每执行一次工具调用、每校验一次中间结果、每做出一次下一步行动决策,都会消耗 Token。从外部看只是一行 API 调用,内部可能已经运行了十轮以上的推理循环。

成本优化建议:

  1. 开发阶段务必开启 Token 日志,密切监控每个任务的实际消耗曲线
  2. 对于长期运行的智能体任务,一定要开启上下文缓存(Context Caching),重复输入内容最多可节省 75% 的成本
  3. 非实时批量任务可以选择延迟 1-15 分钟的弹性推理档位,费用直接打 5 折

结语

Gemini API 托管智能体在预览阶段就将开发门槛降到了前所未有的高度:一行代码就能获得带沙箱隔离、完整工具链和状态持久化的自主智能体。这不是提示词工程的又一个花哨功能,而是 AI 智能体应用从 "极客玩具" 跨向 "生产级标准" 的实质性一步。

可以预见,在接下来的几个月里,AGENTS.mdSKILL.md很可能会成为项目仓库中的标配文件,与Dockerfilerequirements.txt拥有同等重要的地位。2026 年的夏天,或将成为个人智能体应用脱离实验阶段、大规模进入生产环境的历史拐点。

对于希望快速拥抱这一技术趋势的开发者而言,选择一个专业可靠的 AI 服务平台至关重要。UseAIAPI 作为全球领先的 AI 大模型服务提供商,整合了 Gemini、Claude、ChatGPT、DeepSeek 等多款全球热门 AI 大模型,为用户提供一站式接入解决方案。平台支持支付宝、微信人民币直充,无需复杂的外币卡配置和海外网络环境,注册即可快速上手。

针对不同规模的用户需求,UseAIAPI 还提供完善的分级服务体系:个人用户可享受便捷的自助式服务与灵活的充值方案;企业用户则可获得专属技术支持、99.9% 以上的 SLA 服务保障、定制化接口开发与全方位的数据安全解决方案。在价格方面,UseAIAPI 推出了极具竞争力的长期优惠政策,折扣最低可达官方价格的 50%,大幅降低了 AI 应用的开发与运营成本,让开发者不再为高强度内容生成带来的高额消耗而担忧。