← 返回 Blog

Anthropic 杀疯了:Sonnet 5 限时 2 美元/百万 token,Opus 4.8 用户连夜迁移

7 月 1 日,Anthropic 正式推出 Claude Sonnet 5 大模型,产品上线后很快引发行业调用格局的变化。不少开发者陆续将原本基于旗舰模型 Opus 4.8 的 API 调用需求,切换至新款中端模型。从从业者分享的成本数据来看,模型切换后调用支出出现明显下降,高性价比成为此次迁移潮的核心驱动因素。

ClaudeClaude CodeClaude Sonnet 5 重塑大模型调用成本格局

性能逼近旗舰叠加定价优势 Claude Sonnet 5 重塑大模型调用成本格局

7 月 1 日,Anthropic 正式推出 Claude Sonnet 5 大模型,产品上线后很快引发行业调用格局的变化。不少开发者陆续将原本基于旗舰模型 Opus 4.8 的 API 调用需求,切换至新款中端模型。从从业者分享的成本数据来看,模型切换后调用支出出现明显下降,高性价比成为此次迁移潮的核心驱动因素。

定价梯度拉开差距 规模化场景成本优势突出

从定价来看,推广期内 Sonnet 5 的调用价格为输入 2 美元 / 百万 token、输出 10 美元 / 百万 token,仅为 Opus 4.8 标准定价(输入 5 美元 / 百万 token、输出 25 美元 / 百万 token)的四成。即便 8 月 31 日促销活动结束后,Sonnet 5 回归 3 美元 / 百万 token 输入、15 美元 / 百万 token 输出的标准定价,仍比 Opus 4.8 低 40%。

对于高用量的企业级项目,这一定价差带来的成本缩减十分可观。有行业人士测算,一个中型智能体项目若日均消耗 500 万 token 输入量,使用 Opus 4.8 每月输入侧成本约 7500 美元;切换为促销期的 Sonnet 5 后,对应成本仅约 1500 美元,节省的开支足以覆盖一名初级技术人员的人力成本。在明确的成本收益下,模型调用迁移成为不少技术团队的务实选择。

多维度性能追平旗舰 能力下沉超出行业预期

如果仅靠低价,并不足以驱动大规模的用户迁移。Sonnet 5 真正改变市场判断的,是其综合性能已全面逼近旗舰级的 Opus 4.8。

多项权威基准测试数据显示,Sonnet 5 的核心能力已覆盖 Opus 4.8 九成以上的水平。编程能力测试 SWE-bench Pro 中,Sonnet 5 得分 63.2%,与 Opus 4.8 的 69.2% 相差 6 个百分点,较前代 Sonnet 4.6 提升 5.1 个百分点;终端执行测试 Terminal-Bench 2.1 中,Sonnet 5 取得 80.4% 的成绩,较前代暴涨 13.4 个百分点,与 Opus 4.8 的 82.7% 仅差 2.3 个百分点;跨学科推理测试 Humanity's Last Exam 中,搭载工具调用能力的 Sonnet 5 得分 57.4%,与 Opus 4.8 的 57.9% 仅相差 0.5 个百分点;知识工作基准 GDPval-AA v2 测试中,Sonnet 5 更是以 1618 分反超 Opus 4.8 的 1615 分。

Anthropic 在官方文档中表示,Sonnet 5 具备自主制定计划、调用浏览器与终端工具的能力,而这样的表现在几个月前还需要参数规模更大、成本更高的旗舰模型才能实现。这也意味着,大模型的旗舰级能力正在向中端产品快速下沉,且下沉速度超出行业普遍预期。

分词器升级带来成本变化 中文场景享受实质降价

在成本测算中,也有从业者注意到了容易被忽略的细节:Sonnet 5 启用了全新的分词器(tokenizer),相同内容对应的 token 拆分数量较前代有所变化。

开发者实测数据显示,不同语言的 token 膨胀率存在差异:英文文本 token 数量约增加 40%,西班牙语约增加 33%,Python 代码约增加 28%,而简体中文文本的 token 数量基本与前代持平。这也意味着,标注单价的下降并不完全等同于实际账单的同比例下降。

以英文场景为例,Sonnet 5 促销期输入单价为 2 美元 / 百万 token,叠加 30% 左右的 token 增量后,等效实际成本约为 2.6 美元 / 百万 token,虽仍显著低于 Opus 4.8 的 5 美元,但相较前代 Sonnet 4.6 的 3 美元标准价,优势幅度有所收窄。有行业分析机构测算,Sonnet 5 单任务运行成本约为前代的两倍,部分场景下甚至略高于 Opus 4.8。

不过对于中文用户而言,新分词器的影响几乎可以忽略,简体中文场景下的 token 膨胀率接近 1,标注降价即为实际降价。同时,Anthropic 设置的两个月促销期也为开发者提供了过渡缓冲,帮助用户逐步适应新的计费规则。

精准卡位市场需求 中端产品承接大众市场价值

此次产品发布的时间节点与产品策略,也被业内视为一次精准的战略布局。此前受美国出口管制新规影响,Anthropic 旗下两款顶级模型曾暂停全球访问,高端产品线暂时无法全面开放市场。Sonnet 5 的上线,恰好填补了高端产品受限期间的市场空白,以接近旗舰的能力承接企业级需求。

与此同时,Anthropic 将 Sonnet 5 设为免费版与专业版用户的默认模型,数千万日活用户将默认使用这款性能接近旗舰的中端模型。对于高频调用工具、反复迭代输出的智能体场景,成本敏感度更高,中端模型的高性价比恰好匹配这类大众场景的需求,能够快速扩大用户覆盖规模。

整体来看,Sonnet 5 的出现正在重构大模型的产品分层格局:旗舰模型继续聚焦高难度核心任务,中端模型则以极高的性价比承接绝大多数日常生产需求。随着能力的持续下沉,中端产品的市场价值还将进一步凸显。

对于企业与开发者而言,大模型产品的快速迭代,既带来了能力升级的红利,也对选型灵活性与成本管控能力提出了更高要求。选择稳定可靠的一站式接入平台,能够更灵活地适配不同模型、控制整体调用成本。

目前,UseAIAPI 已同步接入 Claude 全系列、Gemini、GPT 系列、DeepSeek 等全球主流热门大模型,覆盖智能体开发、内容生产、数据分析等多元应用场景,支持一站式便捷调用与企业级定制化接入服务,无需复杂部署即可快速适配各类业务需求。在调用成本方面,平台专属优惠最高可达官方定价的 50%,能够有效降低高并发、大用量场景下的算力消耗压力,帮助企业与开发者在享受前沿模型能力的同时,实现成本的精细化管控,无需为高强度调用的算力消耗过度顾虑。