选择您感兴趣的模型和评测数据集,或直接查看热门对比组合
至少选择2个模型,如果没有选择任何评测基准,则默认选择最多8个公共评测基准进行对比
Claude Haiku 4.5与Anthropic的前代模型对比
最新DeepSeek-V3.1和前代DeepSeek-V3和DeepSeek-R1的评测对比
中美最强开源大模型对比
GPT-5、Gemini 2.5 Pro和Gro4三大模型对比