MMEB-v2-Image 评测基准详情

MMEB(Massive Multimodal Embedding Benchmark)是一个用于评估多模态嵌入模型的基准测试框架。该基准最初聚焦于图像-文本嵌入,并在后续版本中扩展到文本、图像、视频和视觉文档输入。MMEB通过收集多样化数据集,提供一个统一的评估平台,用于测试模型在分类、检索和其他任务上的性能。

Views18
问题数量
36
发布机构
TIGER-Lab
评测类别
图像向量嵌入
评测指标
Accuracy
支持语言
英文
难度等级
中等难度

简介

用于评测大模型图像向量嵌入能力的评测基准

MMEB-v2-Image 大模型得分排行榜

数据来源:DataLearnerAI

模式说明:
normal
thinking
low
medium
high
deeper thinking
parallel_thinking
图表加载中...

MMEB-v2-Image详细排名数据表格