MMEB-v2-Image 评测基准详情
MMEB(Massive Multimodal Embedding Benchmark)是一个用于评估多模态嵌入模型的基准测试框架。该基准最初聚焦于图像-文本嵌入,并在后续版本中扩展到文本、图像、视频和视觉文档输入。MMEB通过收集多样化数据集,提供一个统一的评估平台,用于测试模型在分类、检索和其他任务上的性能。
Views18
问题数量
36
发布机构
TIGER-Lab
评测类别
图像向量嵌入
评测指标
Accuracy
支持语言
英文
难度等级
中等难度
简介
用于评测大模型图像向量嵌入能力的评测基准
相关资源
MMEB-v2-Image 大模型得分排行榜
数据来源:DataLearnerAI
模式说明:
normal
thinking
low
medium
high
deeper thinking
parallel_thinking
图表加载中...
详细评测数据
MMEB-v2-Image详细排名数据表格
| 排名 | 模型 | |||
|---|---|---|---|---|
| 1 | 80.12 | 2026-01-08 | 80 | |
| 2 | 77.99 | 2025-12-15 | 未知 | |
| 3 | 77.78 | 2025-06-28 | 未知 | |
| 4 | 74.96 | 2026-01-08 | 20 | |
| 5 | 55.95 | 2024-12-24 | 70 | |
| 6 | 51.89 | 2024-12-24 | 20 |