微软推出 XOT 方法，提升语言模型推理能力

11 月 15 日消息，微软近日推出了名为“Everything of Thought”（XOT）的方法，灵感来自谷歌 DeepMind 的 AlphaZero，利用紧凑的神经网络，来增强 AI 模型推理能力。

微软和佐治亚理工学院、华东师范大学合作开发了该算法，整合了强化学习（reinforcement learning）和蒙特卡洛树搜索（MCTS）能力，在复杂决策环境中，进一步提高解决问题的有效性。

IT之家注：微软研究团队表示 XOT 方法可以让语言模型扩展到不熟悉的问题上，在 Game of 24、8-Puzzle 和 Pocket Cube 严苛测试中提升明显。结果表明，XOT 明显优于其他方法，甚至解决了其他方法失败的问题。但是，XOT 并没有达到 100% 的可靠性。