PokéLLMon是首个在战术战斗游戏中实现人类水平性能的LLM体现代理。它融合了三种关键策略:1)基于上下文的强化学习,即时利用从战斗中提取的文本描述反馈,迭代地优化其生成策略;2)知识增强生成,利用外部知识对抗幻觉,使代理能够及时和正确地行动;3)具有自一致性的动作生成,以减轻当代理面对强大对手并希望避免战斗时的惊慌切换现象。与人类玩家在线对战展示了PokéLLMon的人类级别战斗性能和策略,在梯队比赛中取得49%的胜率,在邀请赛中取得56%的胜率。此外,我们揭示了其对人类玩家的消耗战略和欺骗技巧的脆弱性。
点击前往PokéLLMon官网体验入口
需求人群:用于与人类玩家进行在线 Pokémon 战斗
使用场景示例:
在PokéLLMon网站上与其他玩家进行实时 Pokémon 对战。 与朋友一起体验PokéLLMon的人类级别战斗性能。 通过PokéLLMon学习战术战斗游戏的优秀策略。产品特色:
基于上下文的强化学习 知识增强生成 自一致性动作生成 在线与人类玩家对战 人类级别战斗性能和策略