中科院和汪军团队发布大模型玩星际争霸秀到起飞

面对星际争霸II这一巨大挑战，团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架，将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语义动作，而微观操作则交由一套固定的规则式方法处理。LLMagent能够在全新的战场上与游戏内置的AI展开较量。

论文地址:https://arxiv.org/pdf/2312.11865.pdf

项目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII

在星际争霸II的战场上，进行有效决策需要及时处理大量复杂信息，进行合理的战略分析与长期规划，最终制定宏观战略决策。团队创新性地提出了「ChainofSummarization」方法。

该方法通过单帧总结和多帧总结，提高了LLM在复杂环境中的理解和决策能力。在验证ChainofSummarization方法的有效性方面，团队选择了GPT-3.5-turbo-16k作为LLM。结果表明:ChainofSummarization不仅将LLM与游戏端的交互速度提升了十倍，还显著增强了模型对游戏情境的理解及决策能力。

团队精心设计了一套复杂的提示词系统，包括游戏状态总结，状态分析，策略建议，最终决策。模型能够全面理解游戏的当前局势，分析敌我双方的策略，并提出具有战略深度的建议，最终做出多步的合理决策。这极大地提高了LLM的实时决策能力和长期规划能力，也极大提升了决策的可解释性。

中科院和汪军团队发布 大模型玩星际争霸秀到起飞

中科院和汪军团队发布大模型玩星际争霸秀到起飞