Meta AI 的研究人员联合多家学术机构推出了一种名为 LIGER(LeveragIng dense retrieval for GEnerative Retrieval)的新型 AI 模型。该模型巧妙地结合了密集检索和生成检索的优势,显著提升了生成式推荐系统的性能。
项目背景:推荐系统在将用户与相关内容、产品或服务联系起来方面发挥着重要作用。传统的密集检索方法通过序列建模计算项目和用户表示,但这种方法需要大量的计算资源和存储,随着数据集的增长,其可扩展性受到限制。而生成检索方法虽然减少了存储需求,但在冷启动项目中表现不佳。
项目介绍:LIGER 模型混合了生成检索的计算效率和密集检索的精度,利用生成检索生成候选集、语义 ID 和文本属性的项目表示,再通过密集检索技术进行精练,平衡了效率和准确性。具体来说,LIGER 采用双向 Transformer 编码器和生成解码器,整合了项目文本表示、语义 ID 和位置嵌入,并使用余弦相似度损失进行优化。生成部分则使用波束搜索根据用户交互历史预测后续项目的语义 ID。
LIGER 性能:在 Amazon Beauty、Sports、Toys 和 Steam 等基准数据集上的评估显示,LIGER 的性能持续优于 TIGER 和 UniSRec 等现有最先进模型。例如,在 Amazon Beauty 数据集上,LIGER 对冷启动项目的 Recall@10 得分为 0.1008,而 TIGER 为 0.0;在 Steam 数据集上,LIGER 的 Recall@10 达到了 0.0147,同样优于 TIGER 的 0.0。随着生成方法检索的候选数量增加,LIGER 与密集检索的性能差距缩小,展现了其适应性和效率。
LIGER 有效地解决了传统推荐系统在计算资源、存储需求和冷启动项目处理上的难题,为构建更高效、更精准的推荐系统提供了新的思路。