
Chrome 上线 Gemini 自动浏览功能 代理式交互开启浏览器智能新形态
2026 年 1 月起,谷歌开始在 Chrome 浏览器中低调推送 Gemini Auto Browse(自动浏览)实验性功能。该功能打破了传统浏览器 “用户手动操作、工具被动响应” 的交互逻辑,让 AI 智能体可自主完成网页浏览、信息筛选、表单填写等操作,将 Chrome 从被动的信息获取工具,升级为具备自主执行能力的 AI 终端。近日有开发者通过多场景连续测试,完整还原了该功能的实际表现、适用场景与能力边界。
一、功能内核:模拟键鼠操作的网页智能体
与聚焦代码开发的 AI 智能体不同,Auto Browse 的核心定位是 “替用户完成网页操作”:用户只需通过自然语言下达目标指令,AI 即可自主完成页面滚动、按钮点击、内容填写、站点跳转等动作,全程通过模拟鼠标、键盘的方式交互网页元素,而非仅提取网页文本投喂模型。
从服务规则来看,该功能目前主要面向美国地区开放,仅 Google AI Pro、AI Ultra 付费订阅用户可使用,且设置了每日执行次数上限。技术架构上,日常操作指令由本地设备发起,复杂推理环节依托云端 Gemini 3.x 系列模型完成,网页操作相关内容会短暂同步至账号活动记录中。用户界面上出现的动态光标,正是 AI 通过 “虚拟键鼠” 执行操作的直观体现,每一步动作都由云端模型实时决策。
二、三场景实测:效率优势与能力边界清晰可辨
为验证功能的真实落地效果,开发者选取了三类典型的网页操作场景,完成了总计 12 分钟的连续测试,功能表现呈现出鲜明的场景差异化特征。
(一)标准化站点操作:流程顺畅效率显著
房产平台房源筛选是适配度最高的场景之一。测试者下达指令:“筛选 Redfin 收藏夹内的两居室房源,仅保留允许饲养宠物的房源,移除标注‘禁止宠物’的收藏项”。
指令下发后,Gemini 侧边栏自动开启专属执行区域,标签页标题旁出现操作标识,AI 依次点击进入收藏房源详情页,滚动至宠物政策板块,自主判断房源是否允许饲养猫、狗,最终移除不符合要求的收藏项。全程耗时不到 4 分钟,无需人工编写脚本或手动操作筛选,这一场景也被谷歌官方列为功能示范用例。(二)跨站复杂任务:非标准界面易遇阻滞
跨平台酒店比价是更复杂的测试场景,指令为:“查询芝加哥 7 月 3 日 - 5 日与 7 月 10 日 - 12 日两个时段的酒店价格与 Expedia 机票价格,对比哪个周末出行总价更低”。
测试中,AI 一次性打开 5 个标签页,分别查询酒店官网房价与机票价格,核算总价后生成对比表格,基础流程耗时约 5 分钟。但执行过程中也出现了明显卡顿:Expedia 的日期选择器交互逻辑复杂,AI 多次点击才选中正确日期;页面弹出的促销弹窗超出了 AI 的处理能力,直接导致任务停滞,需人工关闭弹窗后才能继续执行。 这也反映出当前功能的核心局限:在结构清晰、规则固定的标准化站点中运行顺畅,但面对交互设计复杂的界面或突发弹窗时,处理能力会明显下降。(三)购物加购操作:敏感操作严守安全红线
第三项测试为购物场景,指令为:“在 Google Shopping 搜索 Y2K 风格派对装饰,预算 75 美元以内,尝试加入购物车并匹配折扣码”。
AI 依次完成搜索、价格过滤、打开商品页面、将符合预算的商品加入购物车等操作,全程耗时 3 分多钟,执行流程完整。但在接近支付环节时,功能触发了明确的安全边界:浏览器弹出 “请手动完成购买” 的提示,AI 不会替用户点击购买、提交按钮,结账与信息提交类操作必须由人工完成,且结账前会展示静态复核页面供用户确认。三、行业观察:代理式浏览起步 安全底线不可松动
12 分钟的测试直观展现出 Auto Browse 的核心价值:它能够承接筛选、比价、加购等重复性网页操作,大幅降低用户的机械劳动量。同时,功能的两条核心边界也十分清晰:一是对非标准化页面、突发弹窗的适配能力不足,当前更偏向 “在规则明确的操作集内执行任务”,尚未实现通用的全网页理解;二是支付、表单提交等敏感操作严格锁定人工确认,这并非技术缺陷,而是当前阶段最合理的信任安全边界。
据了解,该功能的技术演进可追溯至谷歌早年的 Project Mariner 浏览器智能体实验,当前版本的 Auto Browse 在交互常驻性、任务追踪透明度、权限管控精细化程度上均有显著提升。尽管尚未实现 “从搜索到付款” 的全流程无人闭环,但已经跨过了代理式浏览的关键门槛,标志着浏览器正式从 “信息展示窗口” 向 “智能执行终端” 演进。
对于个人用户而言,浏览器端的 AI 功能提供了轻量化的效率提升;而对于需要规模化落地 AI 智能体能力的企业与开发者而言,专业、稳定、高性价比的 API 服务,是深度定制业务场景的核心支撑。UseAIAPI 聚合全球主流前沿 AI 大模型能力,覆盖 Gemini、Claude、GPT、DeepSeek 等多款旗舰产品,可提供一站式稳定接入服务,无需复杂配置即可快速将 AI 能力融入各类业务流程。
针对企业级用户,UseAIAPI 还支持定制化部署方案,可根据不同业务场景匹配专属接入架构,全程保障服务稳定性与数据安全。成本层面,平台推出专属优惠政策,调用价格最低可达官方定价的 50%,大幅降低大模型高频调用的成本压力,让企业与开发者无需为高强度业务场景的算力消耗顾虑,平稳推进 AI 技术落地与业务效率升级。