Kimi新模型DeepSeek R1:揭秘全球独占巅峰!
月之暗面发布Kimi-Dev-72B:全球最高开源模型,引领软件工程新纪元
近日,月之暗面公司宣布推出一款针对软件工程任务的全新开源代码大模型——Kimi-Dev-72B。这款模型在SWE-bench Verified编程基准测试中取得了令人瞩目的成绩,以仅72B的参数量,超越了参数量达671B的新版DeepSeek-R1,成为全球最高开源模型。
强化学习优化,确保解决方案的正确性和稳健性
Kimi-Dev-72B通过大规模强化学习进行优化,具备自主修补Docker中真实存储库的能力。它只有在整个测试套件通过时才会获得奖励,这一机制确保了解决方案的正确性和稳健性。其设计理念和技术细节包括BugFixer和TestWriter的组合、中期训练、强化学习和测试时自我博弈。
![]()
BugFixer与TestWriter:互补设计奠定基础
BugFixer和TestWriter的互补设计是Kimi-Dev-72B的基础,使其在修复错误和编写测试方面表现出色。这种设计使得模型能够高效地处理复杂的编程任务。
中期训练则通过约1500亿个高质量的真实数据,增强了模型对实际Bug修复和单元测试的理解,进一步提升了其性能。
强化学习提升代码编辑能力
在强化学习阶段,Kimi-Dev-72B专注于提升其代码编辑能力,使其在文件本地化和代码编辑方面表现出色。这一阶段的训练使得模型能够更好地适应各种编程场景。
![]()
目前,Kimi-Dev-72B已在Hugging Face和GitHub上提供下载和部署,包括模型权重、源代码等,方便开发者使用。
以上就是佳骏游戏快讯原创的《月之暗面发布Kimi-Dev-72B:全球最高开源模型,引领软件工程新纪元》解析,更多深度好文请持续关注本站。
4K画质重现名侦探柯南生死告白,计时引爆摩天楼新篇章震撼来袭
TES vs G2 S15八强战:揭秘《英雄联盟》巅峰对决,谁将问鼎荣耀?
《心之眼》焕新升级!ARCADIA模式强势回归,探索新境界!
Steam更新现神秘图标,全新Steam手柄来袭,开启革命性操控体验!