← 返回 Blog

Bidi 1 来了但没全开?6/26 前 ChatGPT 网页端+App 抢灰度教程,黄气泡别漏了

6 月 23 日,据测试平台 Testing Catalog 监测,部分用户的 ChatGPT 网页端与移动端应用中,已悄然上线全新语音交互选项。Bidi 取自 Bidirectional(双向)的缩写,它既不是新一代大模型,也并非视频生成工具升级,而是一次针对语音交互底层逻辑的架构革新。

OpenAIOpenAI Bidi 1 启动灰度测试

OpenAI Bidi 1 启动灰度测试 双向语音交互重构 AI 对话体验

6 月 23 日,据测试平台 Testing Catalog 监测,部分用户的 ChatGPT 网页端与移动端应用中,已悄然上线全新语音交互选项。Bidi 取自 Bidirectional(双向)的缩写,它既不是新一代大模型,也并非视频生成工具升级,而是一次针对语音交互底层逻辑的架构革新。

目前该功能仍处于灰度测试阶段,采用分批次推送、分区域开放的节奏,尚未全面上线。本文将拆解 Bidi 1 的核心特性、功能识别方式,以及现阶段获取测试资格的可行路径,为用户提供清晰参考。

一、交互模式升级:从单工对讲到全双工实时对话

要理解 Bidi 1 的价值,首先要厘清它与传统语音交互的核心差异。

过往的 AI 语音交互类似 “对讲机” 模式,属于单工轮替机制:用户按住按键发言,松开后 AI 才开始生成回复,二者无法同时进行,对话全程存在明确的等待间隙。

Bidi 1 则将交互体验升级为 “通话” 模式,实现了真正的双向并行。AI 在输出语音的同时,可实时识别用户的语音输入,支持随时打断并即时响应。在实测演示中,让 Bidi 1 从 1 数到 10,当数到 3 时用户发出 “倒着数” 的指令,模型无需等待当前输出结束,也无需用户重新下发完整指令,会立刻从 3 开始倒数。

这一流畅体验的背后,是并行处理架构的支撑。内测数据显示,该功能的语音识别延迟可低至 0.3 秒,较旧版本提速近 5 倍。

除此之外,还有两处细节优化进一步贴近自然对话:

  • 自然停顿承接:用户发言语速放缓或出现短暂停顿时,模型会以轻声应答承接对话,而非长时间静默等待;
  • 内嵌实时翻译:对话过程中可自动完成语种转换,无需单独调用翻译工具。

业内观点认为,这一升级释放出明确信号:语音交互正从 AI 产品的附属功能模块,逐步向核心交互入口演进。

二、功能识别:黄色气泡为专属标识

用户无需反复进入设置页面,通过界面视觉特征即可快速判断是否获得测试资格。

在设置面板的模型选择栏中,Bidi 1 与 “标准语音”“高级语音” 选项并列展示。选中该模式后,对话界面的消息气泡将从默认蓝色切换为醒目的黄色 —— 黄色气泡即代表 Bidi 1 双向模式已激活,蓝色气泡则为常规模式。

这一设计降低了功能确认成本,用户只需瞥一眼对话界面,即可清晰判断当前交互模式。

三、灰度资格获取:五种方式提升开通概率

截至目前,OpenAI 尚未正式官宣 Bidi 1 功能,整体采用小范围灰度、分区域逐步开放的策略。在功能全面上线前,用户可通过以下方式尝试获取测试资格:

  1. 升级最新客户端版本。灰度功能仅对最新版本客户端开放,网页端用户可刷新页面同步最新状态,移动端用户可前往应用商店检查版本更新。
  2. 主动查看设置面板。该功能不会主动推送弹窗通知,多数获得资格的用户均为主动查询时发现,可进入设置页面的模型选择栏查看是否新增对应选项。
  3. 切换英文界面尝试。OpenAI 灰度测试通常优先面向英文界面用户开放,部分区域推送存在滞后,将 ChatGPT 语言设置切换为英文后再次查看,可提升命中概率。
  4. 同步测试多端入口。网页端与移动端的灰度推送进度并不完全同步,若单端未获得资格,可尝试在另一终端登录查看。
  5. 留意内测申请渠道。有行业资讯渠道披露了相关内测申请入口,用户可按需提交信息,进一步提升开通概率。

四、体验价值:打破语音交互的排队感

“双向并行” 的技术特性,看似只是体验细节的优化,实则重构了语音交互的整体节奏。

过去使用 AI 语音助手,用户始终需要遵循 “等对方说完再发言” 的规则,这种隐形的 “排队感”,是语音交互始终未能完全替代文字交互的重要阻碍。Bidi 1 打破了这层壁垒,用户可以随时打断、纠正、追问,对话的主导权完全交还给使用者,整体体验更贴近真实的人际交流。

据业内预测,OpenAI 大概率将于近期扩大 Bidi 1 的测试范围;而面向开发者的 Codex 系列独立语音升级、API 端的能力开放,还需等待后续的版本迭代。

对于普通用户而言,现阶段可随时留意客户端内的功能更新。看到黄色气泡,即意味着已拿到双向语音对话的测试入场券;暂未收到推送也无需着急,灰度测试本就是逐步开放的过程,后续覆盖范围将持续扩大。

对于企业与开发者而言,语音交互能力的迭代,也为 AI 应用的场景落地打开了新的想象空间。想要及时跟进前沿模型能力、稳定接入全球主流大模型,专业的 API 服务平台可提供高效助力。UseAIAPI 覆盖全球多款热门 AI 大模型,包含 GPT、Claude、Gemini、DeepSeek 等前沿模型的全功能接入支持,无需等待区域灰度推送,即可便捷调用核心能力。平台同时提供企业级定制化服务,可根据业务场景匹配专属接入方案,全程保障链路稳定与数据安全;在成本层面,平台专属优惠力度最低可达官方定价的 50%,能够有效降低高频调用、高强度内容生成场景下的算力消耗成本,帮助企业与开发者以更可控的成本,快速落地前沿 AI 能力。