近期,AI领域迎来了一项重大突破,月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩,以60.4%的准确率刷新了全球开源模型的最高纪录。
据了解,Kimi-Dev-72B是专为软件工程任务量身打造的,尽管其参数量仅为720亿,但在SWE-bench Verified测试中,却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量,但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。
Kimi-Dev-72B之所以能够在测试中脱颖而出,得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库,并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性,使其更加贴合实际的软件开发标准。
Kimi-Dev-72B的模型权重和源代码已经全面开源,并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展,为开发者们提供更加高效、智能的工具。