阿里云震撼开源:Qwen-72B问鼎业界最强大模型 填补中国大模型空白

   发布时间:2023-12-01 15:15

【智快网】12月1日消息,阿里云在最新的技术动态中宣布了一项引人注目的开源计划。该公司正式推出通义千问720亿参数模型Qwen-72B,成为业界最强大的开源大模型之一,成功超越开源标杆Llama 2-70B和多数商用闭源模型。这一举措在全球范围内引起广泛关注,未来,企业级和科研级的高性能应用将有了更多的开源选择。

据智快网了解,通义千问除了发布Qwen-72B外,还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。这标志着通义千问已经实现了“全尺寸、全模态”开源,共计推出4款大语言模型,以及两款多模态大模型,为开发者和研究者提供更加广泛的选择。

Qwen-72B基于高质量的3T tokens数据进行训练,在10个权威基准测评中表现抢眼,超越了GPT-3.5和GPT-4等闭源模型。在英语、中文、数学推理和代码理解等各个任务领域,Qwen-72B都展现出卓越的性能,成功领跑开源模型榜单。

据智快网了解,通义千问的720亿参数模型在多项权威测评中获得最优成绩,部分成绩甚至超越了GPT-3.5和GPT-4。其处理长文本输入的能力较强,取得了在长文本理解测试集Leval上超越ChatGPT-3.5-16k的显著效果。此外,Qwen-72B还搭载了强大的系统指令能力,用户只需一句提示词即可定制AI助手,实现了更高程度的个性化服务。

此次发布填补了中国大模型领域的空白,使得国内企业和科研机构能够在开源框架下开发更多商业应用和科研项目。Qwen-72B以其高性能、高可控、高性价比的优势,为用户提供了不逊于商业闭源大模型的选择。

阿里云表示,用户可以通过魔搭社区直接体验Qwen系列模型效果,也可以通过阿里云灵积平台调用模型API,或者在阿里云百炼平台上定制大模型应用。阿里云人工智能平台PAI还推出了多项深度适配服务,包括轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等,为用户提供更加便捷的开发和应用体验。

除了Qwen-72B,发布会上还首次开源了音频理解大模型Qwen-Audio。Qwen-Audio具备感知和理解各类语音信号的能力,用户可通过输入音频实现对语音内容的理解,甚至进行文学创作、逻辑推理、故事续写等操作。这使得大模型在听觉方面迈出了重要的一步,赋予了更加接近人类的听觉能力。

阿里云CTO周靖人表示,通义千问将持续致力于开源,希望成为“AI时代最开放的大模型”,与开发者伙伴共同推动大模型生态的建设。此次开源计划不仅促进了中国大模型的技术进步,也为广大开发者提供了更多的创新空间。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群