王者荣耀AI突破:TiG框架助AI掌握高阶战略思维

41 5

腾讯研究团队于2025年9月推出TiG(Think in Games)框架,以《王者荣耀》为训练环境,成功填补了大型语言模型(LLM)在战略推理与实时决策方面的能力差距。该框架通过40种预定义宏观动作(如“推上路”、“夺龙”)将游戏状态转化为语言建模任务,采用监督学习(SFT)与强化学习(GRPO)两阶段训练法,使Qwen3-14B模型在游戏决策中达到90.91%的准确率,超越参数量更大的DeepSeek-R1(86.67%),并保留原有文本理解与数学推理能力。 TiG框架旨在解决现有AI模型的功能鸿沟问题。传统AI模型在游戏中能正常游玩,却无法理解自身决策;而语言模型虽然能推理策略,却难以执行操作。TiG框架通过让模型在游戏中同步思考和行动,实现了这一目标。 研究团队以《王者荣耀》为训练范本,定义了40种宏观行动,如推上路、击杀暴君、守家等,并要求AI模型在每个场景下选择最佳策略并解释原因。 训练分为两个阶段:首先在监督学习中学习策略的基本机制,然后通过奖励机制进行强化学习,正确行动得1分,错误行动得0分。 研究团队测试了多种语言模型,包括Qwen2.5(7B、14B、32B)、Qwen3-14B模型,并使用DeepSeek-R1大模型作为对照组。他们从DeepSeek-R1中提取高质量训练数据,并使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。 最终,经过TiG框架训练的模型不仅能制定行动计划,还能解释原因。例如,AI会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。 测试结果显示,Qwen3-14B模型的决策准确率达到90.91%,超越参数量更大的DeepSeek-R1(86.67%),而Qwen2.5-32B和Qwen2.5-14B模型的准确率也分别从66.67%和53.25%提升至86.84%和83.12%。

王者荣耀AI突破:TiG框架助AI掌握高阶战略思维

全力冲刺,明年4月《马拉松》全新升级震撼来袭!

TES速通世界赛BO5仅用半小时,创最短记录!震撼速通新纪录!

4万捡漏百万豪车却遇纵梁切割,倒贴5万修复背后内幕大揭秘

《疯狂动物城2》创纪录同屏5万兽,视觉盛宴再升级!

小米领跑智能音箱市场,48.8%份额彰显创新实力

艾达王鼻环设计考究,黑妹COS造型引人瞩目

第二太阳新纪元开启!星际FPS战力升级,巅峰体验再度来袭

今日上市PS5 Pro开箱评测:国行版值得入手吗?深度解析!

《诉讼女王》口碑逆袭,烂番茄评分逆风翻盘,口碑新高峰!

富豪遭绑命悬一线,500俯卧撑逼出惊人真相

刘强东前瞻:一周一工作,快递无人配送新纪元

《博人传》销量低迷,鸣佐回归重燃热血传奇

《怪物猎物》传奇续篇,D加密PC畅玩,体验全新冒险之旅

10天线下课仅需48000元,李阳疯狂英语高效提升英语能力!

2026永冻纪元抢先测试曝光!带你揭开冰封世界新纪元神秘面纱

评论列表
  1. 椰奶分形 回复
    之前看AI打王者缺战略感,TiG框架出来后不一样了,能看到AI懂高阶战略布局,这波属实有点牛啊
  2. 青柠分形 回复
    之前王者AI只会瞎莽,TiG框架太顶了!现在它懂高阶战略配合,跟我组队超舒服~
  3. 芋圆坍缩 回复
    TiG框架真牛!让AI有高阶思维,玩王者时明显感觉对手策略更妙,体验提升不少 。
  4. 这框架牛啊!玩王者时AI策略超妙,让对局更有挑战,体验超赞 。
  5. 松饼递归 回复
    这TiG框架真牛!让AI有高阶思维,玩王者时明显感觉AI更懂战略,游戏体验提升不少。