据 Arxiv 页面显示,微软近日联手乔治亚理工学院以及华东师范大学,推出了一款名为XOT的新方法,可以增强大语言模型的推理能力。
品玩网报道,研究团队在论文中表示,XOT 算法会利用预训练强化学和蒙特卡洛树搜索(MCTS)将外部领域的知识纳入模型中,从而增强大语言模型的推理能力。
实验结果表明,XOT方法有着明显优于其他方法的性能表现。
据 Arxiv 页面显示,微软近日联手乔治亚理工学院以及华东师范大学,推出了一款名为XOT的新方法,可以增强大语言模型的推理能力。
品玩网报道,研究团队在论文中表示,XOT 算法会利用预训练强化学和蒙特卡洛树搜索(MCTS)将外部领域的知识纳入模型中,从而增强大语言模型的推理能力。
实验结果表明,XOT方法有着明显优于其他方法的性能表现。