加载中...
加载中...
GPT-4 当前已收录的代表性评测结果包括 MMLU(30 / 63,得分 86.40)、HumanEval(27 / 38,得分 67)、DROP(7 / 7,得分 80.90)。本页还提供与 1 个竞品模型及 2 个前代或同系列模型的对比,在有数据时会展示性能和价格视图。并附有 1 个数据来源链接供参考。
将 GPT-4 与同类头部模型进行多维评测对比,直观展示各项得分差异
垂直视图
前 3 项可对比评测得分汇总
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。
追踪 GPT-4 系列模型的迭代轨迹,直观展示代际性能变化
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。