在软件开发领域,一场深刻的变革正悄然发生,AI编程正逐步迈向全新阶段。Cursor作为AI编程工具的先锋,其团队提出AI编程已进入“第三时代”,云端智能体凭借强大的计算机使用能力,正重塑编程的工作模式与权力结构。
回顾AI赋能软件开发的历程,大致可分为三个阶段。2024年,以GitHub Copilot等产品为代表,开启了AI编程的第一阶段。这一阶段,AI主要作为“超级输入法”,通过Tab自动补全功能,处理低熵、重复性的代码片段。开发者在主导逻辑设计的同时,借助AI减少击键次数,AI成为提升效率的杠杆。然而,此时AI的作用相对有限,仅能完成一些基础、琐碎的编码工作。
到了2025年下半年,AI编程进入第二阶段,智能体的崛起成为关键标志。随着模型上下文窗口的扩大和工具调用能力的增强,开发者与AI的交互模式发生了变化,从简单的Tab补全转变为“提示 - 响应”的同步循环。开发者可以通过提示,指挥AI编写特定模块。但这一阶段的人机交互仍较为“手把手”,每一步决策和输出都需要人类实时审阅与纠偏。尽管如此,智能体的出现还是极大地提升了编程效率,Cursor中智能体的使用量在过去一年增长超过15倍,如今大多数用户已很少使用Tab键。数据显示,2025年3月,Cursor的Tab用户数量是智能体用户的2.5倍,而现在智能体用户数量已反超,是Tab用户的2倍。
当下,AI编程正加速迈向第三阶段,新一代云端智能体展现出强大的能力。它们不再依赖开发者的逐条指令,而是能够在更长时序上自主规划、迭代与交付。就像一组资深工程师组成的开发团队,云端智能体接收目标后,会自行拆解任务、调用工具、验证结果,最终以“可评审的工件”形式向用户交付成果。这种交付方式与以往以代码片段为主的形式截然不同,为软件开发带来了更高的效率和更完整的功能。
云端智能体的优势不仅体现在自主能力上,还在于其解决了资源与注意力瓶颈问题。与本地运行的智能体不同,云端智能体每个都运行在自己的虚拟机上,开发者可以将任务交给它们后,转而处理其他事务。智能体会在数小时内持续工作,反复迭代和测试,并通过日志、视频录像和实时预览等富媒体形式向用户汇报进展。这种资源解耦与富媒体交互的方式,使得并行运行多个智能体成为可能。在Cursor内部的代码提交中,已有35%是由在云端虚拟机中自主运行的智能体创建的,这充分表明开发者对云端智能体这种高效方式的认可。
在实际开发场景中,云端智能体展现出了强大的应用能力。在构建新功能方面,当接收到“为插件组件添加源码链接”的指令后,智能体能够自主解析文件结构、构造GitHub链接、更新前端逻辑,并录制自己点击验证链接有效性的全过程视频,最终提交可直接合并的代码。在复现安全漏洞时,面对“剪贴板窃取”漏洞描述,智能体可自主构建HTML演示页面、启动本地服务器、在应用内浏览器中加载并执行攻击流程,输出包含操作录像与截图的详细分析报告,大大降低了安全团队的复现成本。在UI自动化测试中,智能体对文档站点进行45分钟全流程走查,测试侧边栏、搜索、主题切换等十余项功能,自动生成测试总结与异常截图,将QA效率提升数倍。在快速修复与验证方面,针对“Lint标签动态更新”需求,智能体不仅实现逻辑代码,还在桌面应用中分别测试“有错误”与“无错误”两种状态,录制验证视频确保修复效果符合预期。这些场景表明,云端智能体不再局限于生成代码片段,而是具备了端到端交付可验证功能的完整能力链。
随着云端智能体的广泛应用,软件开发中的人机关系也发生了重构。开发者逐渐从亲自编写代码的角色转变为“AI车队”的指挥官。软件开发变得如同自动驾驶一般流畅,智能体开始承担合并代码提交、管理发布和监控生产环境等任务。在这个新模式下,采用云端智能体工作方式的开发者具有一些共同特征:几乎100%的代码由智能体编写,他们将更多时间花在拆解问题、审查结果以及提供反馈上,并且会同时启动多个智能体,而非手把手引导单个智能体完成任务。这种转变要求开发者培养新的技能,从“手写优雅代码”转向“精准定义问题边界”“设计鲁棒的验收标准”以及“高效协调多智能体协作”。虽然编程语言的语法细节或许不再关键,但系统思维、领域知识与质量判断力将变得愈发重要。























