MMEB-v2-Image
MMEB(Massive Multimodal Embedding Benchmark)是一个用于评估多模态嵌入模型的基准测试框架。该基准最初聚焦于图像-文本嵌入,并在后续版本中扩展到文本、图像、视频和视觉文档输入。MMEB通过收集多样化数据集,提供一个统一的评估平台,用于测试模型在分类、检索和其他任务上的性能。
更新于 2026-01-09
711 次浏览
问题数量
36
发布机构
TIGER-Lab
评测类别
图像向量嵌入
评测指标
Accuracy
支持语言
英文
难度等级
中等难度
简介
用于评测大模型图像向量嵌入能力的评测基准
相关资源
MMEB-v2-Image 大模型得分排行榜
数据来源:DataLearnerAI
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模式说明:
normal
thinking
low
medium
high
deeper thinking
parallel_thinking
图表加载中...
MMEB-v2-Image评测最新大模型排名与完整榜单数据
查看 MMEB-v2-Image 的最新得分、模型模式、发布时间与参数规模,快速了解当前完整榜单表现。
MMEB-v2-Image详细排名数据表格
| 排名 | 模型 | |||
|---|---|---|---|---|
| 1 | 80.12 | 2026-01-08 | 80 | |
| 2 | 77.99 | 2025-12-15 | 未知 | |
| 3 | 77.78 | 2025-06-28 | 未知 | |
| 4 | 74.96 | 2026-01-08 | 20 | |
| 5 | 55.95 | 2024-12-24 | 70 | |
| 6 | 51.89 | 2024-12-24 | 20 |