月之暗面Kimi-Dev-72B开源,刷新全球AI软件工程基准测试成绩!

   发布时间:2025-06-17 15:44 作者:苏婉清

近期,AI领域迎来了一项重大突破,月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩,以60.4%的准确率刷新了全球开源模型的最高纪录。

据了解,Kimi-Dev-72B是专为软件工程任务量身打造的,尽管其参数量仅为720亿,但在SWE-bench Verified测试中,却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量,但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出,得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库,并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性,使其更加贴合实际的软件开发标准。

Kimi-Dev-72B的模型权重和源代码已经全面开源,并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展,为开发者们提供更加高效、智能的工具。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群