VQAScore是一种新的文本到视觉生成评估指标,通过CLIP-FlanT5模型计算图像与文本提示的匹配度,优于传统CLIPScore。它使用VQA模型评估生成图像,提供简单有效的评估方法,并推出GenAI-Bench基准测试,挑战现有生成模型。
项目地址:
https://linzhiqiu.github.io/papers/vqascore
本文地址:https://www.163264.com/10033
VQAScore是一种新的文本到视觉生成评估指标,通过CLIP-FlanT5模型计算图像与文本提示的匹配度,优于传统CLIPScore。它使用VQA模型评估生成图像,提供简单有效的评估方法,并推出GenAI-Bench基准测试,挑战现有生成模型。
项目地址:
https://linzhiqiu.github.io/papers/vqascore
本文地址:https://www.163264.com/10033