网站首页
编程语言
数据库
系统相关
其他分享
编程问答
MMVU
2025-01-23
【AI论文】MMVU:衡量专家级多学科视频理解能力
摘要:我们推出了MMVU,这是一个全面的专家级、多学科视频理解基准,用于评估基础模型在视频理解方面的表现。MMVU包含3000个由专家标注的问题,这些问题涵盖了四个核心学科领域的27个主题:科学、医疗保健、人文与社会科学以及工程学。与以往的基准相比,MMVU具有三大关键进步。首先,它要