生成式AI发展迅猛,但全面评估其性能一直是难题。近期,卡耐基梅隆大学和Meta合作推出VQAScore评测方案,利用视觉问答模型评分,准确性超越传统方法。
新评测基准GenAI-Bench推动文生图模型发展,提供更全面、具有挑战性的评测。VQAScore存在局限性,但随着VQA模型进步,性能将提升。
VQAScore评测方案利用视觉问答模型给文生图模型打分,准确性超越传统方法。
GenAI-Bench评测基准推动文生图模型发展,提供更全面、具有挑战性的评测。
VQAScore存在局限性,但随着VQA模型进步,性能将进一步提升。