模型对比
本页面提供了GPT-5,GPT-4o模型在GPQA Diamond,HLE等评测基准中的详细对比数据,评测数据来源当前系统收录结果生成。数据如有问题可以通过微信公众号联系更正,感谢!
GPT-5
OpenAI 发布的基础大模型模型。
GPT-4o
OpenAI 发布的多模态大模型模型。
GPT-5模型与主流模型各评测基准得分对比表
评测基准 | GPT-5 thinking + 使用工具 | GPT-5 thinking | GPT-5 normal | GPT-4o normal |
---|---|---|---|---|
GPQA Diamond
常识推理
|
87.3 | 85.7 | 77.8 | 70.1 |
HLE
知识问答
|
35.2 | 24.8 | 6.3 | 5.3 |