在2026年GTC大会的开幕现场,英伟达创始人黄仁勋身着标志性的黑色皮夹克,以一如既往的自信姿态登上舞台。他宣布,这场盛会不仅是一场科技聚会,更是英伟达生态系统的全面展示。今年恰逢CUDA生态成立20周年,黄仁勋回顾了英伟达从GeForce显卡到光线追踪技术,再到AI智能体的演进历程,强调CUDA生态已形成强大的数据飞轮效应,构建起一个庞大的商业帝国。
此次发布会上,英伟达推出了专为智能体AI设计的Vera Rubin平台,其算力高达3.6艾次浮点运算,结合全新机架系统,每兆瓦算力吞吐量较前代提升35倍。同时,公司还发布了一款面向单线程高性能场景的CPU——Rosa CPU,采用全球首款数据中心级LPDDR5内存,在单线程性能和能效比上表现卓越。黄仁勋透露,Rosa CPU已投入量产,并成为英伟达新的数十亿美元级业务。
Vera Rubin平台由7款突破性芯片和5个机架级系统组成,打造出一台面向通用智能的超级计算机。该系统采用全液冷设计,消除传统线缆,通过NVLink 72技术实现260TB/s的全对等带宽。其机架配置包括专为编排与通用工作负载设计的Vera CPU机架、基于BlueField-4的AI原生存储STX机架,以及与Vera Rubin深度互联的Groq 3 LPX机架。后者集成了230MB片上SRAM,进一步提升了整体运算速度。
黄仁勋展示了Rubin Ultra的垂直插入设计,通过全新Groq机架在一个NVLink域内连接144颗GPU。他指出,新一代NVLink系统取代了传统铜缆,解决了传输距离限制问题,将前端计算与后端NVLink交换机整合为一台巨型计算机。针对AI时代对存储系统的极高要求,英伟达重新设计了存储架构,以应对大语言模型规模扩大带来的内存压力。
在芯片架构的商业价值讨论中,黄仁勋提出tokens将成为新的大宗商品。他预测,未来tokens市场将分层分级:免费套餐提供高吞吐量但低速度的服务;中端套餐支持更大模型和更长输入上下文;高端套餐则面向关键任务或超长研究场景,每百万tokens定价可达150美元。他以研究员日均消耗5000万tokens为例,说明这种定价模式对研究团队的可行性,并展示了资源分配模型:将数据中心功耗均分给不同层级套餐,以实现营收最大化。
根据英伟达的测算,采用Blackwell平台的营收可比Hopper提升5倍,而Vera Rubin平台则能再带来5倍增长。黄仁勋还介绍了Groq的确定性数据流处理器架构,其静态编译与编译器调度特性使其专为推理工作负载优化。目前,Groq 3 LPU已进入量产阶段,预计第三季度开始出货。
在软件生态方面,英伟达推出了企业级OpenClaw参考方案NemoClaw。黄仁勋将其类比为Windows之于个人电脑的时代意义,强调OpenClaw为智能体计算机提供了开源操作系统。NemoClaw内置智能体AI工具集,支持用户直接下载、使用和二次开发,并能对接全球所有SaaS公司的策略引擎。该方案通过OpenShell模块实现安全策略执行和网络护栏设置,确保智能体在企业环境中的安全运行。
黄仁勋认为,未来企业将转型为"智能体服务公司",员工薪酬结构也可能包含tokens额度。他设想,企业将在基础年薪外提供等值tokens作为补充,使员工生产力提升10倍。在这种模式下,软件公司将成为tokens的生产者、使用者和提供商。
在物理AI领域,英伟达宣布比亚迪、吉利、现代和日产加入其Robotaxi平台合作伙伴网络。这些厂商年产量达1800万辆,加上此前合作的奔驰、丰田和通用,支持全自动驾驶的车辆规模将显著扩大。英伟达还计划将传统无线电塔升级为搭载Aerial AI RIM技术的智能基站,实现交通状况感知和智能波束赋形。
发布会展示了多款开源工具,包括用于机器人训练的Isaac Lab、微分物理仿真引擎Newton、世界模型Cosmos,以及开源机器人基础模型GR00T。压轴登场的迪士尼雪宝机器人演示了英伟达仿真技术在娱乐领域的应用。黄仁勋表示,英伟达此次发布的技术栈覆盖了从AI芯片到智能体系统,再到物理AI和自动驾驶的完整产业链,为开发者和企业提供了可直接落地的解决方案。





















