选择您感兴趣的模型和评测数据集,或直接查看热门对比组合
对比通义千问最新发布的Qwen2系列主要模型
比较Llama 3, Qwen2, GLM-4等顶级开源模型
GPT-4o vs Claude 3 Opus vs Gemini 1.5 Pro
在HumanEval和MBPP上比较模型的代码生成能力