GPT-4o(2024-11-20)vsGPT-4o
GPT-4o(2024-11-20) 与 GPT-4o 在 7 个共同 benchmark 中整体接近:GPT-4o(2024-11-20) 领先 2 项,GPT-4o 领先 2 项,持平 3 项,平均分差 -1.37。
GPT-4o(2024-11-20)
OpenAI · 2024-11-20 · 聊天大模型
GPT-4o
OpenAI · 2024-05-13 · 多模态大模型
GPT-4o(2024-11-20)2 项(29%)持平3(29%)2 项GPT-4o
评测分数
按能力类目分组,每组内按分差大小排列;共 7 项。
数学推理
GPT-4o 领先 1/2| 评测项 | GPT-4o(2024-11-20) | GPT-4o | 分差 |
|---|---|---|---|
| MATH | 68.5024 / 42 | 75.9016 / 42 | -7.40 |
| FrontierMath | 0.3057 / 60 | 0.3057 / 60 | 持平 |
综合评估
GPT-4o 领先 1/2| 评测项 | GPT-4o(2024-11-20) | GPT-4o | 分差 |
|---|---|---|---|
| MMLU | 85.7037 / 65 |
规格对比
| 字段 | GPT-4o(2024-11-20) | GPT-4o |
|---|---|---|
| 发布机构 | OpenAI | OpenAI |
| 发布时间 | 2024-11-20 | 2024-05-13 |
| 模型类型 | 聊天大模型 | 多模态大模型 |
| 架构 | 稠密模型 | 稠密模型 |
| 参数规模 | 暂无数据 | 0.0 |
| 上下文长度 | 128K | 128K |
| 最大输出 | 暂无数据 | 16384 |
API 调用价格
价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。
| 价格项 | GPT-4o(2024-11-20) | GPT-4o |
|---|---|---|
| 文本输入 | 暂无公开价格 | 2.5 美元/100万 tokens |
| 文本输出 | 暂无公开价格 | 10 美元/100万 tokens |
部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。
小结
- GPT-4o(2024-11-20)在以下类目领先:编程与软件工程 (1/2)、常识问答 (1/1)
- GPT-4o在以下类目领先:数学推理 (1/2)、综合评估 (1/2)
7 个共同 benchmark 上,GPT-4o 平均高出 1.37 分。
单项差距最大的 benchmark:MATH — GPT-4o(2024-11-20) 68.50,GPT-4o 75.90(分差 -7.40)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。