科技魔方

趣味项目CLoT:训练LLM更幽默地回答问题

大模型

2023年12月13日

  近日,研究人员通过日本传统喜剧游戏“大喜利”(Oogiri)对AI进行了一项新的挑战,以培养AI成为吐槽高手。在这个游戏中,AI需要理解给定的图文信息,并以幽默搞笑的方式做出回答。

  Oogiri是一种需要参与者对给定的图像或文本做出意想不到且幽默的回应的创意游戏,包括图像到文本(I2T)、文本到文本(T2T)和图像&文本到文本(IT2T)的测试方式。

  为了训练AI参与Oogiri游戏,研究人员构建了一个多模态、多语言的Oogiri-GO数据集,其中包含超过130,000个样本。通过特殊的训练方法,他们让AI学会如何在游戏中给出创意和幽默的回答。

  其中,CLoT首先将Oogiri-GO数据集转化为LoT导向的指令调整数据,以训练预训练的LLM达到一定的LoT幽默生成和辨别能力。然后,CLoT设计了一个探索性自我完善过程,鼓励LLM通过探索看似无关概念之间的平行关系来生成更多创造性的LoT数据,并选择高质量数据进行自我完善。

  实验结果显示,CLoT能够显著提高LLM(如Qwen和CogVLM)在多种Oogiri游戏类型中的表现。具体来说,CLoT帮助LLM生成了更好的幽默内容,并在Oogiri游戏的多项选择和排名问题中取得了更高的性能。

  此外,CLoT还在其他任务中提高了创造性能力,显示出其卓越的泛化能力,为AI的幽默表现和创意生成能力带来了新的突破。

+1

来源:站长之家

延展资讯