Anthropic上线Claude Code“计算机使用”功能开启AI编程从思考到行动全新时代

Anthropic上线Claude Code“计算机使用”功能开启AI编程从思考到行动全新时代

补齐代码生成到执行验证全流程闭环，60 天密集更新勾勒智能体完整战略布局

【旧金山讯】在开源项目 OpenClaw 让全球开发者验证了 AI 桌面操作能力的可行性后，Anthropic 正式将这一能力从社区创意升级为 Claude Code 官方标配功能，推出全新 “计算机使用” 能力，彻底打破传统 AI 编程工具的能力边界。

从 “键盘英雄” 到全流程执行者，补齐 AI 开发最后一块拼图

传统 AI 编程工具，无论是 GitHub Copilot 还是早期版本的 Claude Code，本质上都是 “键盘英雄”。它们的核心能力局限于生成代码、输出文本建议，而代码编译、运行、调试、验证的全流程落地，仍需开发者手动完成。此次 Claude Code 上线的 “计算机使用” 功能，彻底补齐了这一能力短板。它不止能生成代码，更能自主打开终端执行编译指令、启动应用程序，通过模拟鼠标点击、键盘输入、屏幕捕捉完成全流程操作，自主发现问题、修复代码、重新验证效果。整个流程中，开发者仅需在终端输入一次提示词，即可实现全环节自动化执行。

这一能力的落地，依托于 Anthropic 完整的智能体执行框架，核心是名为 “基于计算机” 的内置 MCP 服务器。 MCP 是 Anthropic 近年来重点推进的接口标准，用于统一大模型与外部工具、数据源的交互逻辑。在这套架构中，Claude 承担决策核心角色，CLI 为交互入口，MCP 服务器负责工具调度，本地系统提供执行环境。

Claude 的视觉识别能力，来自于持续截屏对屏幕内容的实时识别，再基于识别结果生成鼠标、键盘操作指令，完全复刻人类 “用眼观察、用手操作” 的电脑使用逻辑。过往代码执行出现问题时，开发者需要手动复制报错信息、截屏反馈给 AI，再等待解决方案输出。如今 Claude 可直接查看编译后的程序界面，通过模拟用户操作定位视觉与逻辑漏洞，这种 “所见即所得” 的调试模式，大幅降低了多工具切换的时间与操作成本。

三级决策分层调度，实现效率与成本的最优平衡

Anthropic 为这套能力设计了精细化的分层调度机制，避免无差别接管键鼠操作带来的效率损耗。收到任务指令后，Claude 会遵循明确的三级优先级执行操作。

第一优先级，是调用对应应用的 MCP 服务器或原生连接器，比如 Slack、Gmail、Google Workspace 等已完成官方集成的服务，这是最快、精度最高的执行方式。第二优先级，是调用 Bash 命令行或 Chrome 扩展完成操作。只有当前两种路径均无法实现目标时，才会启用 “计算机使用” 作为兜底方案，接管鼠标、键盘与屏幕完成操作。

这套分层决策机制，本质上是对执行成本与效率的优化。 GUI 操作是通用性最强，但执行速度最慢、精度最低的方式，因此仅作为最终兜底手段。简单来说，能调用 API 就绝不移动鼠标，能执行命令就绝不点击按钮，这是工程设计上的精准权衡，而非能力局限。

端到端开发闭环落地，覆盖多场景开发需求

“计算机使用” 功能最受开发者关注的核心价值，是实现了从需求提出到效果验证的完全自动化闭环。

以 macOS 菜单栏应用开发为例，Claude 可自主编写 Swift 代码，调用 Xcode 完成编译，启动应用后逐一点击菜单项与控制项完成功能验证。若程序出现崩溃，Claude 会自主排查问题、修复代码，再重新编译验证，全程无需开发者离开终端、切换 IDE 或进行任何手动操作。

在 UI 测试场景，这一能力彻底颠覆了传统工作流。过往 UI 测试需要开发者配置 Playwright、Selenium 或 XCTest 等框架，编写大量测试脚本才能完成。如今开发者仅需用自然语言描述测试需求，Claude 即可自主打开应用、完成全流程操作、对每个步骤截屏留存，标注出卡顿或异常节点，无需配置测试框架，也无需维护脆弱的元素选择器。

针对视觉布局调试的痛点，该功能也提供了全新解决方案。 CSS 布局 bug 往往仅在特定窗口尺寸下出现，手动复现与调试耗时耗力。开发者只需告知 Claude 对应的布局问题，它即可自动调节窗口尺寸复现故障，截屏记录异常状态，读取样式表并完成 CSS 代码修复，所见画面与开发者完全一致，无需通过文字描述进行场景猜测。

对于没有 CLI 或 API 接口的专有软件，包括设计工具、硬件控制面板、iOS 模拟器等，“计算机使用” 能力同样可以适配。这意味着大量此前只能手动操作的遗留系统，如今都可被纳入自动化流程之中。

原生嵌入安全机制，全流程管控操作风险

让 AI 直接接管电脑操作，天然存在极高的安全风险，而 Anthropic 在功能设计之初，就将安全机制嵌入了底层架构。

当 Claude 首次尝试操作某款应用时，终端会弹出清晰的权限请求弹窗，明确公示三项核心信息：Claude 拟控制的具体应用名称、操作是否涉及剪贴板等敏感资源、操作期间是否会隐藏其他应用。用户可自主选择 “允许本次会话” 或 “拒绝” 该权限请求。

针对不同应用类别，系统设置了差异化的权限管控等级。浏览器与交易平台类应用被限制为只读权限，终端与 IDE 仅开放点击权限、禁止文本输入，其余常规应用才可获得完全控制权限。

系统同时内置了多重风险管控机制，包括哨兵警告、Esc 键紧急中止、Ctrl+C 强制终止等功能。 Claude 执行操作期间，会自动隐藏其他所有应用，仅保留已获批操作的软件，任务完成后自动恢复原有窗口布局，不打乱用户的工作节奏。此外，终端窗口本身会被排除在截屏范围之外，Claude 既无法看到用户的输入内容，也不会受到屏幕上恶意提示词注入攻击的影响。

Anthropic 还对模型进行了专项训练，使其主动规避高风险操作，包括转账交易、文件修改删除、敏感数据输入等行为。投资交易平台、加密货币应用等程序，已被纳入默认禁用名单。官方同时明确建议，用户应将涉及敏感财务、医疗、个人记录的应用，排除在该功能的使用范围之外。

Anthropic 也公开承认，目前的安全保护措施 “并不完美”，Claude “偶尔会超出预设边界行动”。目前该功能仍处于 “研究预览” 阶段，复杂任务有时需要二次尝试才能完成，屏幕操作的执行速度也慢于直接 API 集成方式。

市场反馈两极分化，60 天密集更新锚定智能体战略

该功能上线后，市场舆论迅速呈现两极分化的态势。一方面，大量开发者对 Claude 实现的全流程自动化能力给予高度认可；另一方面，高昂的 token 消耗成本引发了用户的普遍不满。

“额度光速耗尽，全网哀嚎” 成为社交媒体上的真实写照，大量用户反馈 Claude 的 token 额度在数天内就被耗尽，即便是月付 200 美元的 Max 高级用户，也面临额度快速透支的问题。技术反编译结果显示，系统底层存在两个严重 bug，导致缓存频繁失效，token 消耗成本瞬间暴涨 10 至 20 倍。目前 Anthropic 的工程师正在对该问题进行紧急排查，而成本控制问题，无疑是 “计算机使用” 功能实现大规模商用必须翻越的核心大山。

从企业战略层面来看，“计算机使用” 功能的上线，并非一次孤立的产品更新。 2026 年 2 月，Anthropic 收购了专注于 MacBook 远程操作智能体云计算的 AI 创业公司 Vercept。 3 月初，Claude Code 上线 Auto 模式，在逐步审批与完全权限放行之间找到了平衡方案。 3 月 17 日，Dispatch 功能正式发布，支持用户从移动设备直接向桌面端 Claude 派发语音与文本指令。 3 月 23 日，“计算机使用” 功能正式上线。 3 月 31 日，Scheduled Tasks 功能上线，支持在 Anthropic 托管的云基础设施上运行定时任务。

短短 60 天内，Anthropic 完成了 70 多次产品更新。这些功能的叠加，清晰勾勒出了 Anthropic 的产品路线图：Claude 正在从需要开发者实时监督的编程助手，升级为可跨设备、跨时段持续运行的智能体工作环境。 Channels 是接收外部消息的 “耳朵”，Computer Use 是直接操作界面的 “手”，Scheduled Tasks 是定时触发的 “闹钟”，三大能力同步落地，Anthropic 的全链路智能体布局已然成型。

行业巨头扎堆布局，AI 正式进入从思考到行动的新阶段

一个值得关注的行业现象是，OpenAI 的 Operator（基于 CUA 模型）、Google 的同类产品，几乎在同一时间窗口发布了相似的桌面智能体能力。三家行业头部企业在两周内密集发布同类产品，这种技术路线的趋同并非巧合，而是整个行业对 AI 能力边界的想象，正在发生集体升级。

“计算机使用” 功能的核心价值，不止于帮用户完成鼠标点击、键盘输入的基础操作。它真正改变的，是开发者在生产流程中的角色定位：从亲自执行全流程环节的操作者，转变为向 AI 派发任务、审核最终结果的管理者。开发工作流从线性变为并行，从手动执行变为流程编排。 AI 的 “手” 已经长出来了，接下来的行业竞争，将聚焦于它能驾驭多少工具、完成多复杂的系统性任务。

尽管目前该功能仍有明显的局限性，约 50% 的任务可靠性，意味着它距离真正替代人类手动操作还有很长的路要走，成本问题也亟待解决。但它已经明确了 AI 编程赛道的下一竞争方向：比拼的不再是单条代码的生成速度，而是谁能真正深入用户的工作流，接管所有重复、繁琐、跨应用的操作环节。

Claude 长出 “行动之手” 的这个动作，本身比它当下能完成的任务更具里程碑意义 —— 它标志着 AI 正式完成了从 “思考” 到 “行动” 的关键跨越。

对于想要第一时间体验 Claude 全新能力，以及全球前沿 AI 大模型技术的开发者与企业，UseAIAPI 可提供一站式接入解决方案。 UseAIAPI 覆盖 Gemini、Claude、ChatGPT、DeepSeek 等全球热门 AI 大模型的最新版本接入服务，同时为企业提供专属定制化服务，实现无门槛无忧接入。价格方面，UseAIAPI 推出专属优惠政策，折扣最低可达官方价格的 50%，大幅降低企业与开发者高强度使用 AI 生成内容的成本压力。

|（注：文档部分内容可能由 AI 生成）