科技魔方

即使是顶尖AI模型也难以应对复杂旅行规划,OpenAI o1-preview也犯难

软件应用

2024年10月21日

  最新研究表明,即使是先进的AI语言模型,如OpenAI最新的o1-preview,在复杂的规划任务中也面临挑战。研究发现模型在整合规则和条件方面表现不佳,且随规划时间增加会逐渐失去对问题的关注。尽管一些模型在BlocksWorld中表现尚可,但在更复杂的TravelPlanner任务中表现不佳。

  OpenAI的o1-preview等AI模型在复杂旅行规划上表现不佳,GPT-4o成功率仅7.8%。

  大多数模型在BlocksWorld中表现尚可,但在TravelPlanner上难以达到理想效果。

  模型存在对规则的整合不足及随时间推移而失去焦点的问题。

+1

来源:科技魔方

延展资讯