← 返回 Blog

Anthropic 偷偷秀了段 Fable 5 玩 Factorio 建自动化工厂的视频——这不是 Demo,这是在告诉你"它可以自主操作系统"​

近日,Anthropic 发布的 Claude Fable5 展现出一项颠覆性自主操作能力。在无旁白解说、无专属脚本加持的测试场景中,该模型可在游戏《异星工厂》中从零搭建完整自动化工厂,自主完成资源开采、产线搭建、产能优化与流程运转。这并非简单的 AI 游戏演示,而是人工智能自主操作系统级能力的一次公开落地核验,标志着 AI 环境认知与自主工程推演能力实现全新突破。

ClaudeFable5 实现纯视觉自主系统

Fable5 实现纯视觉自主系统推演 AI 智能操作能力迎来范式升级

近日,Anthropic 发布的 Claude Fable5 展现出一项颠覆性自主操作能力。在无旁白解说、无专属脚本加持的测试场景中,该模型可在游戏《异星工厂》中从零搭建完整自动化工厂,自主完成资源开采、产线搭建、产能优化与流程运转。这并非简单的 AI 游戏演示,而是人工智能自主操作系统级能力的一次公开落地核验,标志着 AI 环境认知与自主工程推演能力实现全新突破。

一、突破游戏场景局限 硬核系统工程能力获验证

不同于《宝可梦》等线性关卡类游戏,《异星工厂》的核心是开放式系统工程模拟,具备极高的技术测试价值。玩家需在荒芜星球上自主开采矿产资源,逐步搭建传送带、组装设备、化工装置,层层迭代构建自动化产业链,最终实现规模化工业生产乃至火箭发射。

整套流程无标准答案、无系统导航提示、无任务指引,全程考验统筹规划、产能配比、资源调度与长期迭代能力,是验证 AI 复杂决策能力的优质场景。

以往 AI 运行《异星工厂》,高度依赖专属学习环境与内部数据读取,通过获取建筑坐标、库存数据、设备状态等结构化信息完成指令执行,本质是依托预设数据解题,并非自主感知决策。而 Fable5 彻底打破这一模式,无需读取系统内部状态、不依赖结构化数据投喂,仅通过屏幕视觉画面,就能自主判断场景状态、制定建设策略、搭建自动化产线。

据 Anthropic6 月 9 日公开宣传资料显示,Fable5 可自主游玩《异星工厂》,独立完成策略制定与工厂搭建。需要说明的是,该成果目前以官方实测展示为主,尚未发布独立同行评审工程报告,可核验粒度略低于 SWE-Bench、OSWorld 等标准化权威基准,但技术突破的方向与实用性已得到充分印证。

二、双核心能力叠加 摆脱传统 AI “上帝模式” 依赖

Fable5 此次突破的核心,是纯视觉理解与长程自主规划两大核心能力的深度融合,彻底摆脱了前代 AI 依赖辅助工具、内部数据的 “上帝模式”。

一方面,视觉理解能力实现质变。相较于早期 Claude 模型需要复杂辅助框架才能运行基础视觉任务,Fable5 仅依靠原始屏幕截图作为唯一输入,即可完成场景识别、状态研判、自主建造、动态优化全流程操作,实现了从 “识别画面元素” 到 “理解场景逻辑、自主决策执行、持续迭代优化” 的跨越式升级。

另一方面,长时复杂任务处理能力大幅提升。Anthropic 官方明确表示,任务越长、逻辑越复杂、迭代步骤越多,Fable5 相较于其他 Claude 模型的性能优势就越显著。这意味着常规短对话评测已无法衡量其能力上限,多步骤、高复杂度、需要持续纠偏的长效工程任务,才是适配该模型的核心应用场景。

两大能力叠加,造就了 Fable5 的硬核实力:无需内存作弊、无需系统权限加持、仅靠视觉感知与逻辑推理,就能从零搭建稳定运转的自动化工业产线。这种像素级视觉推演、自主规划调试、长效系统运维的能力,可直接迁移至真实操作系统的各类复杂场景。

三、三大核心能力底座 筑牢操作系统级应用潜力

Fable5 能够实现自主操作系统推演,依托于编码工程、桌面操控、长时记忆三大硬核能力体系,构筑起全方位的智能作业底座。

在编码与跨文件工程层面,模型在 SWE-Bench Pro 基准测试中取得 80.3% 的优异成绩,具备多文件联动修改、逻辑链路核验、工程代码迭代能力,距离操作系统级组件调度、程序运维仅差权限管控门槛。

在桌面智能操作层面,承袭 Claude Computer Use 技术体系,依托成熟的截图识别、键鼠模拟、界面操控能力,持续优化 OSWorld 场景适配度,桌面复杂任务操控成功率持续提升,逐步达到商用落地标准。

在长时任务记忆层面,百万级 Token 超长上下文窗口搭配自适应思考机制,可保障多步骤复杂任务全程目标不偏移、逻辑不中断、迭代不跑偏,适配长时间、高连贯的系统运维与工程作业。

四、能力持续迁移 打通游戏沙盘与真实系统壁垒

行业早期的《异星工厂》AI 方案,均依托专属学习环境读取游戏内部数据结构实现决策,存在极强的场景局限性。而 Fable5 彻底剥离了外部数据依赖与预设动作映射,仅通过纯视觉感知即可完成全流程操作,实现了技术范式的革新。

这套能力具备极强的跨场景迁移性,可广泛适配各类真实操作系统场景。在老旧设备远程运维中,无需定制专属插件与适配程序,模型可像人工运维人员一样,自主识别控制台画面、研判报错信息、制定修复方案;在智能 GUI 交互场景中,摆脱 API 状态读取依赖,依托视觉闭环自主判断运行进度、完成交互操作。

业内人士表示,目前 Fable5 的纯视觉游戏推演能力,仍属于受控沙盒场景的技术展示,尚未完全落地真实操作系统的自主运维场景,仍需突破权限管控、安全审计、操作回滚、风险降级等多重行业壁垒。

五、安全权限分级管控 暗藏未来技术迭代潜力

值得关注的是,Anthropic 对 Fable5 与高端模型 Mythos5 实施了严格的能力分级管控。针对网络安全、生化科研等敏感场景,系统会无感切换至 Opus 4.8 模型保障安全,Mythos5 可挖掘系统漏洞、修复底层 BUG 的高阶能力,被严格限定在专属安全项目框架内,不对外公开。

但核心技术架构的通用性意味着,Fable5 已具备高阶系统操作潜力,只是通过安全分类器完成了权限约束。从从零搭建自动化工厂,到云端服务器配置、数据库部署、微服务链路搭建,各类数字系统的底层操作逻辑正在逐步打通,AI 自主操作系统的技术雏形已然成型。

随着 Claude Fable5、ChatGPT、Gemini、DeepSeek 等顶级 AI 模型持续迭代,智能系统操作、视觉工程推演、全场景自主运维逐步成为核心生产力。对于开发者、技术团队及企业而言,稳定高效、高性价比的模型接入渠道至关重要。

UseAIAPI汇聚全球主流前沿 AI 大模型,提供一站式无缝接入服务,无需复杂部署调试,可快速适配系统测试、工程开发、视觉推演、智能运维等多元场景,同时支持企业个性化定制解决方案,全方位满足不同规模的商用与研发需求。平台长期推出普惠专属权益,调用折扣最低可达官方定价的 50%,大幅降低高强度模型调用、复杂工程推演、常态化 AI 落地的成本压力,助力各类用户抢抓 AI 系统智能化升级机遇。