阿里千问旗舰新模型Qwen3.5-Max-Preview亮相,多项能力跻身全球前列

   发布时间:2026-03-20 16:15 作者:柳晴雪

阿里旗下千问大模型系列迎来重要更新,其最新预览版Qwen3.5-Max-Preview正式登陆国际权威评测平台LMArena,并在首轮测试中交出亮眼成绩单。该模型以1464分的综合得分跻身全球第一梯队,推动阿里千问实验室进入全球前五、国内榜首位置,标志着国产大模型在国际竞争中的技术突破。

在基础能力专项评测中,该模型展现出强劲实力。通过去除风格控制变量的严格测试,其以1470分位列全球第六、国内第一,超越多数国际主流模型。在Arena Expert专家榜单中,Qwen3.5-Max-Preview以1498分排名第十,紧追GPT-5.4、Claude Opus 4.5等头部模型,同时显著领先于GPT-5.2-chat-latest等同类产品,形成差异化竞争优势。

细分领域表现同样可圈可点。数学能力测试中,该模型成功闯入全球前五,证明其在复杂逻辑运算方面的突破;文本处理领域则跻身全球前十,尤其在专家级任务中展现优异表现。与前代Qwen3-Max相比,新版本在创意写作、数学推理、文体娱乐等高频场景中实现全面提升,其中创意写作提升57分、数学能力提升49分,整体文本处理能力提升45分,呈现均衡发展的技术特征。

技术架构方面,该模型延续了阿里大模型的技术积累。结合前代参数规模推测,Qwen3.5-Max或将成为阿里现有最大的闭源旗舰模型。今年以来,阿里已系统性开源Qwen3.5系列,形成覆盖0.8B至397B参数的完整产品矩阵。其中3970亿参数的Qwen3.5-Plus版本,凭借170亿激活参数的创新设计,在同量级模型中表现突出。

目前发布的预览版仍需接受正式版本的验证考验。随着后续迭代升级,模型在复杂场景下的稳定性、多模态处理能力等关键指标,将成为决定其能否持续领跑国际竞争的重要因素。这场始于实验室的技术突破,正在为国产大模型的商业化应用开辟新的可能性。

 
 
更多>同类内容
全站最新
热门内容
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群