OpenAI推出GPT-5.4模型:具备原生计算机操作能力 开启智能体新篇

   发布时间:2026-03-07 21:41 作者:顾雨柔

人工智能领域迎来重要进展,OpenAI正式推出新一代AI模型GPT-5.4。这款模型在计算机原生操作能力上实现突破性进展,成为首个能够直接操控计算机硬件、跨应用执行任务的智能系统。据技术白皮书显示,该模型在专业文档处理、编程开发等场景中展现出显著优势,尤其在电子表格自动化、演示文稿生成等办公场景中效率提升达40%。

在核心技术层面,GPT-5.4引入了全新的计算机视觉-动作映射系统。通过分析屏幕截图,模型能够自主生成精确的键盘鼠标指令序列,实现从网页浏览到软件操作的完整自动化流程。测试数据显示,在处理需要调用多个API的复合任务时,其指令准确率较前代提升27%,操作延迟降低至1.2秒以内。该模型还优化了网络浏览器交互模块,支持更复杂的网页元素识别与动态内容处理。

针对专业用户需求,OpenAI同步推出三款差异化产品。基础版GPT-5.4已集成至Codex编程平台和开发者API,支持实时代码生成与调试;面向企业用户的Thinking版本增加交互式工作流设计功能,允许用户在模型响应过程中动态调整任务参数;顶配版Pro模型则专为金融分析、科研计算等高负载场景优化,在复杂逻辑推理任务中表现尤为突出。

用户体验方面,ChatGPT网页端和安卓应用已率先上线新功能。当用户提出"制作季度销售报表"等复杂需求时,模型会先生成结构化任务大纲,经用户确认后再逐步执行每个子任务。这种分步交互模式使任务修正效率提升60%,避免了传统AI需要完全重新生成的问题。iOS版本更新正在进行最后测试,预计两周内完成推送。

在性能对比测试中,GPT-5.4展现出强大的信息整合能力。面对需要跨10个网页收集数据的调研任务,其多轮搜索策略使关键信息捕获率提升至92%,答案综合质量评分较GPT-5.2提高33%。错误分析显示,新模型在事实性陈述的准确率达到98.7%,创下OpenAI产品新高。目前该模型已开放企业级定制服务,教育机构可申请专属训练数据接口。

技术团队透露,GPT-5.4的突破得益于新型注意力机制与强化学习框架的结合。其训练数据包含超过2000万小时的计算机操作日志,覆盖主流办公软件的137种交互场景。为确保安全性,系统内置了多层级权限控制模块,所有硬件操作均需用户二次确认。OpenAI表示将持续优化模型的可解释性,未来三个月将开放部分核心算法供学术界研究。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群