← 返回 Blog

火拼Mozilla!Google为何执意推进Prompt API?深度剖析浏览器原生AI的争议与博弈

【旧金山(AP)电】当谷歌在 Chrome 138 版本中正式向全球开发者开放 Prompt API 时,浏览器行业的权力结构发生了不可逆转的倾斜。仅凭一行await ai.languageModel.create()代码,网页就能直接调用设备本地运行的 Gemini Nano 模型,无需申请 API 密钥、无需支付云端费用、用户数据全程不离设备,这项被视作...

【旧金山(AP)电】当谷歌在 Chrome 138 版本中正式向全球开发者开放 Prompt API 时,浏览器行业的权力结构发生了不可逆转的倾斜。仅凭一行await ai.languageModel.create()代码,网页就能直接调用设备本地运行的 Gemini Nano 模型,无需申请 API 密钥、无需支付云端费用、用户数据全程不离设备,这项被视作 Web 开发革命性突破的功能,却在发布次日就遭遇了行业的强烈反对 ——Mozilla 在 GitHub 上提交了措辞激烈的反对文档。这场看似简单的技术争执,本质上是一场关于 “AI 时代,谁来定义 Web 运行时底层规则” 的结构性冲突。

这份反对文档由 Mozilla Web 开发者关系负责人 Jake Archibald 执笔,而他的特殊身份为这场争议增添了更多戏剧性 ——Archibald 曾是 Chrome 核心团队的成员。这位 “局内人” 转身站到对立面,意味着他的批评并非源于对谷歌技术的陌生,恰恰相反,是源于对这项技术底层逻辑的深度了解。

Mozilla 已将对这项 Web 标准提案的官方立场明确标注为 “反对(Opposed)”。“我们持续反对该 API,认为它将对网络平台的互操作性、可更新性和中立性产生严重的负面影响。”Archibald 在 GitHub 的公开讨论帖中明确写道。

这场行业交锋,沿着四个相互关联的核心维度层层递进,牵动着整个 Web 生态的未来走向。

模型锁定风险:Web 互操作性将名存实亡

Archibald 的核心论点,聚焦于一个无法回避的技术现实:不同 AI 模型的输出结果存在天然的、非确定性的差异。为了获得稳定、可靠的产出质量,开发者不可避免地要针对 Gemini Nano 的特性优化提示词 —— 规避它的拒答模式、适应它的输出风格、利用它的潜在偏好。

而这些针对谷歌模型的专属优化,一旦换用其他浏览器的内置模型,可能会完全失效,甚至产生反作用。最终的结果,是整个 Web 生态向 Gemini Nano 单一模型深度倾斜。苹果 WebKit 团队也就此发声,警告了 “模型钙化” 的风险 —— 当浏览器生态被单一模型锁定后,技术创新的动力将逐渐枯竭。

这与传统 Web API 的运行逻辑形成了本质冲突。过往的 Web API 始终遵循 “规范先行” 的原则:不同浏览器的实现遵循同一套行业标准,相同的 JavaScript 代码在不同浏览器中,能稳定运行并返回一致的结果。但 Prompt API 面临着史无前例的困境:AI 模型的非确定性输出,无法通过技术规范实现统一收敛。就连 Prompt API 的官方 README 文档也承认,模型的质量、稳定性以及跨浏览器的互操作性均无法得到保证。

“你的 AI 供应商现在等同于你的浏览器供应商。”Mozilla 在反对文档中一针见血地指出。在远程 API 时代,开发者切换模型供应商只需要修改一行接口地址;而现在,AI 能力与浏览器被深度焊接在了一起。Archibald 警告,这种趋势将迫使苹果和 Mozilla 最终为了 “统一的用户体验”,不得不授权使用 Gemini Nano 模型,而这将把整个行业推向灾难性的方向。

规则溢出越界:平台开始定义 Web 内容的边界

如果说互操作性的争议还停留在纯技术层面,那么第二个核心冲突,已经越过了技术的边界,触及了开放 Web 内容中立性的根基。

使用 Chrome Prompt API 的隐性前提,是必须同意谷歌的《生成式 AI 禁止用途政策》。这份政策明确禁止生成 “令人不安的(disturbing)” 内容,而这类内容的判定标准,完全基于谷歌的单方面定义,而非现有的法律框架。这意味着,一个在法律上完全合法的用户请求,可能会因为触发了谷歌的内部标准而被直接拒绝。

“如果使用某个 Web API 就意味着必须接受特定厂商的内容政策,那么你就不算在为开放平台构建应用。”Archibald 在 GitHub 上的评论道破了其中的核心风险。这类内容政策被嵌入在浏览器 API 层,而非应用的决策层,这意味着所有依赖这一 API 的网页,都将在无形中被强制继承谷歌的价值判断基线。从开放网络的角度来看,这种模式比浏览器插件审核机制、云服务 API 审核,更能直接把控网络内容的流动。

支持幻象争议:谷歌是否夸大了开发者需求?

在向 Blink 开发邮件列表发送的 “意图发布” 官方文档中,谷歌将开发者对 Prompt API 的反馈标记为 “强烈正面(Strong positive)”。但这一说法遭到了 Archibald 的直接驳斥,他认为谷歌严重夸大了这项 API 的实际市场需求。

Archibald 指出,谷歌引用的支持依据,仅仅是一小部分社交媒体帖子的精选内容,将其美化成开发者 “强烈的支持浪潮” 具有明显的误导性,甚至可能为了商业推广向标准委员会成员施加不当压力。

事实上,开发者社区的反馈呈现出明显的两极分化。开发者们确实普遍欢迎免费、离线的本地 AI 能力,但争议的核心从来不是 “要不要端侧 AI”,而是 “这项 API 能否在不绑定特定厂商模型的前提下,实现跨浏览器的互操作”。

谷歌的回应:实验为先的战略逻辑

面对行业尖锐的批评,谷歌 Chrome 工程师 Rick Byers 在官方回应中坦承,他完全理解 Mozilla 对该 API 标准化立场的担忧。但他同时表示,个人更倾向于鼓励技术实验、从错误中学习,而非因为潜在的风险阻碍行业创新。

Byers 的回应,也间接印证了谷歌的长期战略路径:这种 “先发制人” 的操作,在媒体扩展加密方案(EME)、WebAuthn 安全漫游认证等技术的推广中早有先例。对于谷歌而言,第一步是让开发者熟悉并使用这套 API,使其成为开发者的日常开发习惯;第二步,再凭借 Chrome 全球超 60% 的市场份额,将其推动为行业事实标准。

而微软 Edge 的跟进速度超出了行业预期,其已将自家的 Phi-4-mini 模型推向市场,作为全球浏览器巨头之一,微软通过整合本地 AI 模型,间接支持了谷歌的这项提案。

今年年初发布的早期测试数据显示,Gemini Nano 在长文本任务中的失败率达到 15.17%,分类任务的错误率更是高达 23.93%。对于将这套 API 用于复杂业务模块的开发者而言,这些缺陷可能在初期测试中无法完全暴露。但对于谷歌来说,早期版本的性能短板完全在预期之内 —— 基于海量用户的使用数据反哺,模型的精度可以实现快速迭代提升,这正是谷歌 “实验为先” 策略的核心逻辑。

便利与控制:开放 Web 的 AI 时代生存命题

从远程 API 的自由切换,到底层内置 API 的深度锁定,Web 生态的每一次不可逆的便利升级,都在悄然侵蚀着网络的流动性。

谷歌从未否认这一战略的底层考量:如果主流浏览器不拥抱原生端侧 AI,整个 Web 生态的竞争力将被彻底削弱。当下,ChatGPT Atlas、Perplexity 等封闭式智能浏览器正在快速争夺用户,在 AI 时代,传统浏览器已经没有回头路可走。

但这场看似技术层面的争论,其本质关乎一个更核心的行业命题:一个开放的 Web 生态,能否在 AI 时代存活下来?如果能够存活,又该由谁来定义它的边界和运行规则?

对于需要兼顾多浏览器兼容性、规避厂商锁定、追求云端大模型稳定调用体验的开发者及企业用户,UseAIAPI 提供了全链路一站式解决方案,三大核心权益全面解决大模型调用痛点。

其一,全量主流大模型一站式无缝接入。平台已完成全球热门 AI 大模型的全覆盖,包括 Claude、Gemini、ChatGPT、DeepSeek 等最新版本模型,无需用户单独对接多个平台、处理多浏览器适配与厂商锁定问题,开箱即可实现平滑调用,大幅降低研发对接、日常运维的时间与人力成本。

其二,专属企业级定制化服务。针对企业级用户,平台可提供全流程定制化接入方案与 7×24 小时专属技术支持,彻底解决账号风控、调用限流、高并发稳定性、数据安全合规等核心需求,可根据业务场景定制专属算力调度方案,保障业务长期稳定运行,无需用户投入精力维护底层调用架构。

其三,行业极致成本优势。平台所有大模型调用费用,最低可享官方定价 5 折优惠,大幅削减高频调用、高强度内容生成、长上下文会话等场景下的算力消耗成本,即便是大流量生产级业务,也无需为高额的 API 调用费用担忧。