GPT-5.4原生操控电脑能力实测惊艳:OpenClaw迎来最佳搭档

   发布时间:2026-03-06 16:41 作者:冯璃月

深夜,科技圈迎来重磅消息:OpenAI悄然发布GPT-5.4,这款全新模型首次实现了原生电脑操控能力,引发行业震动。实测显示,GPT-5.4不仅能操作文件、程序和终端,还能精准调用各类应用程序,几乎覆盖了人类日常电脑操作的所有场景。

在MacBook实测中,GPT-5.4展现了惊人的操作能力。用户要求设置日历提醒时,模型自动调起日历应用并获取系统权限,瞬间完成提醒设置;当被要求打开“小宇宙”APP并播放指定节目时,GPT-5.4不仅精准定位应用,还能自主选择内容;甚至在计算器应用中,它也能完成复杂运算并返回结果。这种无缝衔接的操作体验,让“原生电脑操控能力”不再停留于概念层面。

行业专家指出,GPT-5.4的核心突破在于其无需依赖外部框架或适配层,就能通过屏幕识别和指令输入直接操控桌面环境。在OSWorld-Verified基准测试中,该模型以75.0%的成功率超越人类平均水平(72.4%),而前代GPT-5.2仅达47.3%。这一数据标志着AI首次在真实桌面导航能力上超越普通用户。

开源AI助手项目OpenClaw成为首批受益者。该项目创始人Peter Steinberger公开表示,GPT-5.4的编程能力提升显著,且在工具调用、长程任务处理等方面表现卓越。OpenClaw社区实测显示,接入GPT-5.4后,系统能稳定维持100万Token的上下文窗口,工具搜索机制使Token消耗降低47%,大幅降低了7×24小时运行的API成本。

行业领袖对GPT-5.4的评价近乎狂热。HyperWriteAI首席执行官Matt Shumer称其为“目前世界上最优秀的模型”,尤其在编程领域表现“近乎完美”;Mercor AI首席执行官Brenda更预言,该模型将取代顶尖咨询公司、投行和律所的专业工作。OpenAI科学家Sebastien Bubeck用梗图调侃:“编程问题已被彻底攻克。”

技术层面,GPT-5.4的突破源于三大创新:原生桌面操作接口、动态工具调用系统和增强型推理引擎。这些特性使其能同时处理多步骤任务,例如自动编写脚本、安装软件并调试错误。OpenClaw官方文档已发布接入指南,社区开发者正加速适配,预计将引发新一轮AI应用革命。

这场变革背后,是AI从“对话工具”向“智能体”的范式转移。当模型能独立完成复杂任务链,其价值已远超文本生成或知识问答。正如Peter Steinberger所言:“GPT-5.4让AI真正开始‘做事’。”随着OpenClaw等开源框架的普及,个人AI员工的时代或许已悄然来临。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群