在华为开发者大会HDC 2025的盛会上,华为云计算的领军人物张平安,以常务董事的身份,向全球开发者揭晓了盘古大模型的最新版本5.5。此次发布,标志着华为在自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算等多个领域取得了重大突破。
盘古NLP大模型迎来了全面革新,其核心的718B深度思考模型,依托256个专家级MoE架构,实现了在知识推理、工具调用及数学领域的显著提升。这一成就,得益于昇腾云的全栈软硬件训练平台,进一步证明了昇腾架构在构建世界级大模型方面的卓越能力。盘古5.5在用户体验上亦有大幅提升,引入了自适应快慢思考合一技术,通过难度感知数据和两阶段训练,使得模型能够灵活应对不同复杂度的问题,整体推理效率跃升8倍。盘古深度研究DeepDiver技术的应用,更是让网页搜索、常识性问答等场景的执行效率实现了质的飞跃。
盘古预测大模型则凭借业界首创的triplet transformer统一预训练架构,实现了跨行业、跨场景的高效预测。这一架构通过三元组编码,将不同行业的数据统一处理,极大地提升了预测精度和泛化能力。在科学计算领域,盘古大模型的应用同样令人瞩目。深圳气象局和重庆市气象局分别基于盘古升级了“智霁”和“天资・12h”气象大模型,不仅提高了天气预报的准确性,还增强了灾害天气的预警能力。深圳能源则利用盘古进行中短期风光水发电量预测,有效提升了能源开发效率。
计算机视觉方面,华为云发布了全新的300亿参数MoE架构视觉大模型,这一模型是目前业界最大的视觉模型,支持多维度、泛视觉的感知、分析与决策。盘古CV大模型通过跨维度生成模型,构建了稀缺的工业场景故障样本库,显著提升了业务场景的可识别种类与精度。在智能驾驶和具身智能机器人领域,盘古多模态大模型的应用更是开创了新篇章。基于盘古世界模型,可以构建数字物理空间,为智能驾驶和智能机器人提供大量的训练数据,无需依赖高成本的实际采集。
盘古大模型5.5的发布,不仅展示了华为在AI领域的深厚积累,更为全球开发者提供了强大的工具和平台。这一系列的创新成果,无疑将为AI技术的发展和应用开辟更加广阔的空间。