OpenAI推出GPT-5.4模型：具备原生计算机操作能力开启智能体新篇-科技-智快网

OpenAI推出GPT-5.4模型：具备原生计算机操作能力开启智能体新篇

发布时间：2026-03-07 21:41 来源：快讯作者：顾雨柔

人工智能领域迎来重要进展，OpenAI正式推出新一代AI模型GPT-5.4。这款模型在计算机原生操作能力上实现突破性进展，成为首个能够直接操控计算机硬件、跨应用执行任务的智能系统。据技术白皮书显示，该模型在专业文档处理、编程开发等场景中展现出显著优势，尤其在电子表格自动化、演示文稿生成等办公场景中效率提升达40%。

在核心技术层面，GPT-5.4引入了全新的计算机视觉-动作映射系统。通过分析屏幕截图，模型能够自主生成精确的键盘鼠标指令序列，实现从网页浏览到软件操作的完整自动化流程。测试数据显示，在处理需要调用多个API的复合任务时，其指令准确率较前代提升27%，操作延迟降低至1.2秒以内。该模型还优化了网络浏览器交互模块，支持更复杂的网页元素识别与动态内容处理。

针对专业用户需求，OpenAI同步推出三款差异化产品。基础版GPT-5.4已集成至Codex编程平台和开发者API，支持实时代码生成与调试；面向企业用户的Thinking版本增加交互式工作流设计功能，允许用户在模型响应过程中动态调整任务参数；顶配版Pro模型则专为金融分析、科研计算等高负载场景优化，在复杂逻辑推理任务中表现尤为突出。

用户体验方面，ChatGPT网页端和安卓应用已率先上线新功能。当用户提出"制作季度销售报表"等复杂需求时，模型会先生成结构化任务大纲，经用户确认后再逐步执行每个子任务。这种分步交互模式使任务修正效率提升60%，避免了传统AI需要完全重新生成的问题。iOS版本更新正在进行最后测试，预计两周内完成推送。

在性能对比测试中，GPT-5.4展现出强大的信息整合能力。面对需要跨10个网页收集数据的调研任务，其多轮搜索策略使关键信息捕获率提升至92%，答案综合质量评分较GPT-5.2提高33%。错误分析显示，新模型在事实性陈述的准确率达到98.7%，创下OpenAI产品新高。目前该模型已开放企业级定制服务，教育机构可申请专属训练数据接口。

技术团队透露，GPT-5.4的突破得益于新型注意力机制与强化学习框架的结合。其训练数据包含超过2000万小时的计算机操作日志，覆盖主流办公软件的137种交互场景。为确保安全性，系统内置了多层级权限控制模块，所有硬件操作均需用户二次确认。OpenAI表示将持续优化模型的可解释性，未来三个月将开放部分核心算法供学术界研究。

更多>同类内容

OpenAI推出GPT-5.4模型：具备原生计算机操作能力 开启智能体新篇

OpenAI推出GPT-5.4模型：具备原生计算机操作能力开启智能体新篇