全球闲置算力训个模型 性能媲美R1 老黄天塌了
分布式RL训练模型INTELLECT-2震撼发布:算力共享,未来已来
一夜之间,全球AI界掀起了一场革命。INTELLECT-2,这个分布式RL训练模型,凭借其独特的去中心化算力整合能力,成为了焦点。它不仅大幅降低了训练成本,更在性能上与DeepSeek-R1相媲美。“一夜之间,老黄天塌了(doge)。”
这句话道出了全球首个分布式RL训练模型INTELLECT-2的震撼。它通过整合全球闲置或分散的计算资源,完成了模型的强化学习训练,使得训练成本大大降低。
去中心化算力,打破垄断格局
一旦这种范式成立,RL训练将不再依赖于集中式算力,任何人都可以参与到模型训练中。这意味着,大公司垄断算力的时代可能就此终结。
“Just like this~算力来算力来,算力从四面八方来。”
这句话生动地描绘了INTELLECT-2的去中心化特性,任何拥有闲置算力资源的人都可以参与其中,共同推动AI的发展。
![]()
INTELLECT-2:全球首个去中心化RL训练的超大规模模型
目前,INTELLECT-2已经得到了19个人/机构的算力资源支持,其中包括Karpathy大神、FlashAttention作者Tri Dao大神、HuggingFace联创兼CEO Clem Delangue等业界大佬。
据团队成员介绍,他们从编写模型强化学习框架prime-rl,到今天发布,仅用了两个月时间。目前基础设施已到位,并且经过验证,超过那些先进实验室只是时间问题。
分布式强化学习训练:众包项目的典范
INTELLECT-2采用了全球分布式异步强化学习的范式,任何拥有闲置算力资源的人都可以参与其中。这种异步执行方式,使得不同性能的设备可以同时参与,而不会相互影响。
具体来说,系统会利用全球贡献者提供的异构算力在本地生成推理数据;这些数据经过验证后汇集到中心,用于更新模型策略;更新后的策略再分发到每个节点,开始新一轮迭代。
四大关键组件,构建去中心化训练生态
INTELLECT-2的四大关键组件——核心RL框架PRIME-RL、参数分发网络SHARDCAST、推理验证协议TOPLOC、Protocol Testnet,共同构建了一个去中心化的训练生态。
![]()
PRIME-RL支持推理数据生成与模型训练的解耦和异步进行,SHARDCAST负责将更新后的模型参数高效分发给全球各地的推理节点,TOPLOC验证每个推理节点提交数据的可信性,Protocol Testnet则为不同学习任务构建独立算力资源池,实现算力贡献和使用的去中心化管理。
未来展望:分布式训练引领AI新潮流
INTELLECT-2的发布,预示着未来顶级开源模型将以分布式方式进行训练。这不仅将推动AI技术的发展,也将为全球AI界带来新的机遇和挑战。
Prime Intellect团队将继续扩大计算市场,扩展去中心化训练,并与开源和去中心化人工智能领域的其他领先项目开展合作,共同推动AI的进步。
以上就是一盒网游原创的《分布式RL训练模型INTELLECT-2震撼发布:算力共享,未来已来》解析,更多深度好文请持续关注本站。
百人激战巅峰:揭秘《绝地求生》之父打造全新100VS100FPS盛宴
首款国产eSIM手机!OPPO Find X9 Pro卫星通信版6999元,开启无限连接新纪元
“格斗女王”张伟丽主演电影《永无止境》11月16日上映,预告片震撼公开,热血燃情!