站内搜索 | 手机版

智快网 - 新科技与新能源行业网络媒体

当前位置：智快网 > 热点 > 正文内容

月之暗面Kimi-Dev-72B开源，刷新全球AI软件工程基准测试成绩！

发布时间：2025-06-17 15:44 来源：ITBEAR 作者：苏婉清

近期，AI领域迎来了一项重大突破，月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩，以60.4%的准确率刷新了全球开源模型的最高纪录。

据了解，Kimi-Dev-72B是专为软件工程任务量身打造的，尽管其参数量仅为720亿，但在SWE-bench Verified测试中，却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量，但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出，得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库，并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性，使其更加贴合实际的软件开发标准。

Kimi-Dev-72B的模型权重和源代码已经全面开源，并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展，为开发者们提供更加高效、智能的工具。

更多>同类内容

iQOO 13性能旗舰大跳水，3899元入手16GB+512GB版本，性价比爆棚！

06-17

小米15S Pro震撼登场：自研玄戒O1芯片搭配2K屏，性价比再升级！

06-17

苹果AI研究引争议：LRM推理极限还是评估方法有误？

06-17

魅族M582Q三证齐全，或成小屏旗舰新选择，5500mAh续航引期待

06-17

紫光展锐多款芯片齐升级，Android 16带来智能流畅新体验！

06-17

华为WATCH 5：鸿蒙AI与玄玑感知，开启智能穿戴新篇章？

06-17

Win11遭用户吐槽“噩梦”，微软高管如何回应？

06-17

华为Pura 80系列：iTAP协议让熄屏支付快如闪电，体验再升级！

06-17

魅族22非遥控器？万志强辟谣，新机屏幕设计或有变动

06-17

苹果homeOS智能家庭平台延期发布，新版Siri成关键瓶颈？

06-17

山科大禁用红米手机考试？小米王化：系技术公司要求

06-17

苹果AI新蓝图：Siri2.0领衔，Knowledge与Copilot能否成新亮点？

06-17

苹果AI标签技术革新App Store，应用可发现性将如何变化？

06-17

Windows 11新省电功能来袭，笔记本续航难题有望解决？

06-17

小米Redmi 14C成国产独苗，全球畅销榜使命小米能否一肩挑？

06-17

点击查看更多 +

全站最新

Meta×Oakley智能眼镜周五发布，扎克伯格力挺，运动科技新风口？

Meta×Oakley智能眼镜周五发布，扎克伯格力挺，运动科技新风口？

AI硬件融入生活，火山引擎引领智能化新浪潮

AI硬件融入生活，火山引擎引领智能化新浪潮

MiniMax深夜发布4560亿参数推理模型M1，百万上下文支持，价格亲民

MiniMax深夜发布4560亿参数推理模型M1，百万上下文支持，价格亲民

小米平板7S Pro月底震撼登场！3nm玄戒O1芯片性能再升级

小米平板7S Pro月底震撼登场！3nm玄戒O1芯片性能再升级

月之暗面开源新大模型Kimi-Dev-72B，登顶全球软件工程开源模型榜首

月之暗面开源新大模型Kimi-Dev-72B，登顶全球软件工程开源模型榜首

iQOO 13性能旗舰大跳水，3899元入手16GB+512GB版本，性价比爆棚！

iQOO 13性能旗舰大跳水，3899元入手16GB+512GB版本，性价比爆棚！

华为鸿蒙系统：从内核到生态，万物互联的命名之旅

华为鸿蒙系统：从内核到生态，万物互联的命名之旅

台积电美厂首批晶圆出炉，但先进封装仍倚重台湾

台积电美厂首批晶圆出炉，但先进封装仍倚重台湾

热门内容

本栏最新

月之暗面Kimi-Dev-72B开源，刷新全球AI软件工程基准测试成绩！

月之暗面Kimi-Dev-72B开源，刷新全球AI软件工程基准测试成绩！

iQOO 13性能旗舰大跳水，3899元入手16GB+512GB版本，性价比爆棚！

iQOO 13性能旗舰大跳水，3899元入手16GB+512GB版本，性价比爆棚！

小米15S Pro震撼登场：自研玄戒O1芯片搭配2K屏，性价比再升级！

小米15S Pro震撼登场：自研玄戒O1芯片搭配2K屏，性价比再升级！

苹果AI研究引争议：LRM推理极限还是评估方法有误？

苹果AI研究引争议：LRM推理极限还是评估方法有误？

魅族M582Q三证齐全，或成小屏旗舰新选择，5500mAh续航引期待

魅族M582Q三证齐全，或成小屏旗舰新选择，5500mAh续航引期待

紫光展锐多款芯片齐升级，Android 16带来智能流畅新体验！

紫光展锐多款芯片齐升级，Android 16带来智能流畅新体验！

华为WATCH 5：鸿蒙AI与玄玑感知，开启智能穿戴新篇章？

华为WATCH 5：鸿蒙AI与玄玑感知，开启智能穿戴新篇章？

Win11遭用户吐槽“噩梦”，微软高管如何回应？

Win11遭用户吐槽“噩梦”，微软高管如何回应？

智快实验室评测约稿合作微信：netspread（注明:智快科技）简体繁体根据客户端智慧切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2021 zhikuai.com All rights reserved. 鲁ICP备20033456号

微信群

微信扫一扫
加微信拉群
电动汽车群
科技数码群