在5月20日的阿里云峰会上,一场关于云计算未来的深度变革被正式揭开。阿里云宣布完成了一次从底层芯片到上层产品入口的全栈技术重构,旨在打造一个面向AI时代的新型云底座。这一举动不仅回应了外界对阿里云巨额投入的质疑,更展示了其在AI基础设施领域的雄心壮志。
阿里云资深副总裁刘伟光指出,随着Agent技术的突破,未来的云计算负载将发生根本性变化。传统的稳态负载模式,即企业长期占用计算资源运行网站或数据库,将逐渐被Agent的突发性和无规律性负载所取代。Agent能够在毫秒间发起多次模型调用,并在任务完成后立即销毁环境,这种模式对云计算资源提出了全新的挑战。
为了应对这一挑战,阿里云提出了“Agentic Cloud”的概念,区别于以往的“AI Native Cloud”。Agentic Cloud不仅关注模型的生产迭代,更致力于为智能体提供运行时所需的全套能力,包括沙箱环境、AI网关、记忆管理和安全防护等。这一变革意味着,阿里云正在从单纯的算力提供者,转变为Agent运行的操作系统。
在芯片层面,阿里云公布了自研芯片的路线图,并发布了新一代训推一体AI芯片真武M890。该芯片拥有144GB显存和800GB/s的片间互联带宽,性能是上一代的3倍。配套发布的ICN Switch 1.0互联芯片,则进一步提升了芯片间的通信效率。阿里云计划在未来两年内推出算力更强的真武V900和真武J900芯片,以与模型迭代节奏保持同步。
在模型与推理平台方面,阿里云通过百炼平台构建了大规模GPU资源集群,并针对Agent场景优化了技术栈。该平台通过池调度提升GPU资源利用率,通过上下文缓存减少重复计算开销,并通过吞吐弹性调度应对并发请求的波峰波谷。百炼平台还引入了Agentic RL机制,基于Agent实际执行反馈进行强化学习,使模型在真实场景中持续迭代优化。
阿里云的最新模型Qwen3.7-Max在性能上也有了显著提升。在三方机构的全球大模型盲测中,Qwen3.7-Max位列国产模型第一,与国际顶尖模型如GPT、Claude和Gemini不相上下。更令人瞩目的是,Qwen3.7-Max在真武M890芯片上自主完成了生产级AI计算内核的编写与调优,性能较官方版本提升10倍,充分展示了模型与芯片协同进化的潜力。
技术架构的重构也带来了商业逻辑的转变。阿里云预计,Agent驱动的MaaS收入将逐渐取代传统的ECS收入,成为其最大的产品线。这一转变意味着,阿里云的商业模式将从以虚拟机为计量单位的资源收入,全面切换为以Token为计量单位的AI收入。阿里云还通过开放生态策略,接入了多家第三方模型,以提供更具性价比的推理服务。






















