Anthropic上线Claude Code“计算机使用”功能 开启AI编程从思考到行动全新时代
Anthropic上线Claude Code“计算机使用”功能 开启AI编程从思考到行动全新时代
补齐代码生成到执行验证全流程闭环,60 天密集更新勾勒智能体完整战略布局
【旧金山讯】在开源项目 OpenClaw 让全球开发者验证了 AI 桌面操作能力的可行性后,Anthropic 正式将这一能力从社区创意升级为 Claude Code 官方标配功能,推出全新 “计算机使用” 能力,彻底打破传统 AI 编程工具的能力边界。
从 “键盘英雄” 到全流程执行者,补齐 AI 开发最后一块拼图
传统 AI 编程工具,无论是 GitHub Copilot 还是早期版本的 Claude Code,本质上都是 “键盘英雄”。 它们的核心能力局限于生成代码、输出文本建议,而代码编译、运行、调试、验证的全流程落地,仍需开发者手动完成。 此次 Claude Code 上线的 “计算机使用” 功能,彻底补齐了这一能力短板。 它不止能生成代码,更能自主打开终端执行编译指令、启动应用程序,通过模拟鼠标点击、键盘输入、屏幕捕捉完成全流程操作,自主发现问题、修复代码、重新验证效果。 整个流程中,开发者仅需在终端输入一次提示词,即可实现全环节自动化执行。
这一能力的落地,依托于 Anthropic 完整的智能体执行框架,核心是名为 “基于计算机” 的内置 MCP 服务器。 MCP 是 Anthropic 近年来重点推进的接口标准,用于统一大模型与外部工具、数据源的交互逻辑。 在这套架构中,Claude 承担决策核心角色,CLI 为交互入口,MCP 服务器负责工具调度,本地系统提供执行环境。
Claude 的视觉识别能力,来自于持续截屏对屏幕内容的实时识别,再基于识别结果生成鼠标、键盘操作指令,完全复刻人类 “用眼观察、用手操作” 的电脑使用逻辑。 过往代码执行出现问题时,开发者需要手动复制报错信息、截屏反馈给 AI,再等待解决方案输出。 如今 Claude 可直接查看编译后的程序界面,通过模拟用户操作定位视觉与逻辑漏洞,这种 “所见即所得” 的调试模式,大幅降低了多工具切换的时间与操作成本。
三级决策分层调度,实现效率与成本的最优平衡
Anthropic 为这套能力设计了精细化的分层调度机制,避免无差别接管键鼠操作带来的效率损耗。 收到任务指令后,Claude 会遵循明确的三级优先级执行操作。
第一优先级,是调用对应应用的 MCP 服务器或原生连接器,比如 Slack、Gmail、Google Workspace 等已完成官方集成的服务,这是最快、精度最高的执行方式。 第二优先级,是调用 Bash 命令行或 Chrome 扩展完成操作。 只有当前两种路径均无法实现目标时,才会启用 “计算机使用” 作为兜底方案,接管鼠标、键盘与屏幕完成操作。
这套分层决策机制,本质上是对执行成本与效率的优化。 GUI 操作是通用性最强,但执行速度最慢、精度最低的方式,因此仅作为最终兜底手段。 简单来说,能调用 API 就绝不移动鼠标,能执行命令就绝不点击按钮,这是工程设计上的精准权衡,而非能力局限。
端到端开发闭环落地,覆盖多场景开发需求
“计算机使用” 功能最受开发者关注的核心价值,是实现了从需求提出到效果验证的完全自动化闭环。
以 macOS 菜单栏应用开发为例,Claude 可自主编写 Swift 代码,调用 Xcode 完成编译,启动应用后逐一点击菜单项与控制项完成功能验证。 若程序出现崩溃,Claude 会自主排查问题、修复代码,再重新编译验证,全程无需开发者离开终端、切换 IDE 或进行任何手动操作。
在 UI 测试场景,这一能力彻底颠覆了传统工作流。 过往 UI 测试需要开发者配置 Playwright、Selenium 或 XCTest 等框架,编写大量测试脚本才能完成。 如今开发者仅需用自然语言描述测试需求,Claude 即可自主打开应用、完成全流程操作、对每个步骤截屏留存,标注出卡顿或异常节点,无需配置测试框架,也无需维护脆弱的元素选择器。
针对视觉布局调试的痛点,该功能也提供了全新解决方案。 CSS 布局 bug 往往仅在特定窗口尺寸下出现,手动复现与调试耗时耗力。 开发者只需告知 Claude 对应的布局问题,它即可自动调节窗口尺寸复现故障,截屏记录异常状态,读取样式表并完成 CSS 代码修复,所见画面与开发者完全一致,无需通过文字描述进行场景猜测。
对于没有 CLI 或 API 接口的专有软件,包括设计工具、硬件控制面板、iOS 模拟器等,“计算机使用” 能力同样可以适配。 这意味着大量此前只能手动操作的遗留系统,如今都可被纳入自动化流程之中。
原生嵌入安全机制,全流程管控操作风险
让 AI 直接接管电脑操作,天然存在极高的安全风险,而 Anthropic 在功能设计之初,就将安全机制嵌入了底层架构。
当 Claude 首次尝试操作某款应用时,终端会弹出清晰的权限请求弹窗,明确公示三项核心信息:Claude 拟控制的具体应用名称、操作是否涉及剪贴板等敏感资源、操作期间是否会隐藏其他应用。 用户可自主选择 “允许本次会话” 或 “拒绝” 该权限请求。
针对不同应用类别,系统设置了差异化的权限管控等级。 浏览器与交易平台类应用被限制为只读权限,终端与 IDE 仅开放点击权限、禁止文本输入,其余常规应用才可获得完全控制权限。
系统同时内置了多重风险管控机制,包括哨兵警告、Esc 键紧急中止、Ctrl+C 强制终止等功能。 Claude 执行操作期间,会自动隐藏其他所有应用,仅保留已获批操作的软件,任务完成后自动恢复原有窗口布局,不打乱用户的工作节奏。 此外,终端窗口本身会被排除在截屏范围之外,Claude 既无法看到用户的输入内容,也不会受到屏幕上恶意提示词注入攻击的影响。
Anthropic 还对模型进行了专项训练,使其主动规避高风险操作,包括转账交易、文件修改删除、敏感数据输入等行为。 投资交易平台、加密货币应用等程序,已被纳入默认禁用名单。 官方同时明确建议,用户应将涉及敏感财务、医疗、个人记录的应用,排除在该功能的使用范围之外。
Anthropic 也公开承认,目前的安全保护措施 “并不完美”,Claude “偶尔会超出预设边界行动”。 目前该功能仍处于 “研究预览” 阶段,复杂任务有时需要二次尝试才能完成,屏幕操作的执行速度也慢于直接 API 集成方式。
市场反馈两极分化,60 天密集更新锚定智能体战略
该功能上线后,市场舆论迅速呈现两极分化的态势。 一方面,大量开发者对 Claude 实现的全流程自动化能力给予高度认可;另一方面,高昂的 token 消耗成本引发了用户的普遍不满。
“额度光速耗尽,全网哀嚎” 成为社交媒体上的真实写照,大量用户反馈 Claude 的 token 额度在数天内就被耗尽,即便是月付 200 美元的 Max 高级用户,也面临额度快速透支的问题。 技术反编译结果显示,系统底层存在两个严重 bug,导致缓存频繁失效,token 消耗成本瞬间暴涨 10 至 20 倍。 目前 Anthropic 的工程师正在对该问题进行紧急排查,而成本控制问题,无疑是 “计算机使用” 功能实现大规模商用必须翻越的核心大山。
从企业战略层面来看,“计算机使用” 功能的上线,并非一次孤立的产品更新。 2026 年 2 月,Anthropic 收购了专注于 MacBook 远程操作智能体云计算的 AI 创业公司 Vercept。 3 月初,Claude Code 上线 Auto 模式,在逐步审批与完全权限放行之间找到了平衡方案。 3 月 17 日,Dispatch 功能正式发布,支持用户从移动设备直接向桌面端 Claude 派发语音与文本指令。 3 月 23 日,“计算机使用” 功能正式上线。 3 月 31 日,Scheduled Tasks 功能上线,支持在 Anthropic 托管的云基础设施上运行定时任务。
短短 60 天内,Anthropic 完成了 70 多次产品更新。 这些功能的叠加,清晰勾勒出了 Anthropic 的产品路线图:Claude 正在从需要开发者实时监督的编程助手,升级为可跨设备、跨时段持续运行的智能体工作环境。 Channels 是接收外部消息的 “耳朵”,Computer Use 是直接操作界面的 “手”,Scheduled Tasks 是定时触发的 “闹钟”,三大能力同步落地,Anthropic 的全链路智能体布局已然成型。
行业巨头扎堆布局,AI 正式进入从思考到行动的新阶段
一个值得关注的行业现象是,OpenAI 的 Operator(基于 CUA 模型)、Google 的同类产品,几乎在同一时间窗口发布了相似的桌面智能体能力。 三家行业头部企业在两周内密集发布同类产品,这种技术路线的趋同并非巧合,而是整个行业对 AI 能力边界的想象,正在发生集体升级。
“计算机使用” 功能的核心价值,不止于帮用户完成鼠标点击、键盘输入的基础操作。 它真正改变的,是开发者在生产流程中的角色定位:从亲自执行全流程环节的操作者,转变为向 AI 派发任务、审核最终结果的管理者。 开发工作流从线性变为并行,从手动执行变为流程编排。 AI 的 “手” 已经长出来了,接下来的行业竞争,将聚焦于它能驾驭多少工具、完成多复杂的系统性任务。
尽管目前该功能仍有明显的局限性,约 50% 的任务可靠性,意味着它距离真正替代人类手动操作还有很长的路要走,成本问题也亟待解决。 但它已经明确了 AI 编程赛道的下一竞争方向:比拼的不再是单条代码的生成速度,而是谁能真正深入用户的工作流,接管所有重复、繁琐、跨应用的操作环节。
Claude 长出 “行动之手” 的这个动作,本身比它当下能完成的任务更具里程碑意义 —— 它标志着 AI 正式完成了从 “思考” 到 “行动” 的关键跨越。
对于想要第一时间体验 Claude 全新能力,以及全球前沿 AI 大模型技术的开发者与企业,UseAIAPI 可提供一站式接入解决方案。 UseAIAPI 覆盖 Gemini、Claude、ChatGPT、DeepSeek 等全球热门 AI 大模型的最新版本接入服务,同时为企业提供专属定制化服务,实现无门槛无忧接入。 价格方面,UseAIAPI 推出专属优惠政策,折扣最低可达官方价格的 50%,大幅降低企业与开发者高强度使用 AI 生成内容的成本压力。
|(注:文档部分内容可能由 AI 生成)
通过 UseAIAPI 统一接入全球主流 AI 大模型
如果你希望更低成本接入 Claude、Gemini、ChatGPT、DeepSeek 等模型,UseAIAPI 提供统一 API 网关、模型聚合、额度管理与企业级技术支持。
进入 useaiapi 控制台