Claude Mythos PreviewvsGPT-5.4 Pro

在 3 个共同 benchmark 中,Claude Mythos Preview 整体领先:Claude Mythos Preview 领先 2 项,GPT-5.4 Pro 领先 1 项,持平 0 项,平均分差 +0.60。

Anthropic
Claude Mythos Preview

Anthropic · 2026-04-07 · 聊天大模型

OpenAI
GPT-5.4 Pro

OpenAI · 2026-03-05 · 多模态大模型

Claude Mythos Preview2 (67%)(33%)1 GPT-5.4 Pro

评测分数

按能力类目分组,每组内按分差大小排列;共 3 项。

General Knowledge

Claude Mythos Preview 领先 2/2
评测项Claude Mythos PreviewGPT-5.4 Pro分差
HLE64.701 / 157Extended (with tools)58.703 / 157Thinking High (With Tools)+6
GPQA Diamond94.601 / 178Extended (no tools)94.402 / 178Thinking High (No Tools)+0.20

AI Agent - Information Search

GPT-5.4 Pro 领先 1/1
评测项Claude Mythos PreviewGPT-5.4 Pro分差
BrowseComp84.904 / 45Extended (with tools)89.302 / 45Thinking High (With Tools)-4.40

规格对比

字段Claude Mythos PreviewGPT-5.4 Pro
发布机构AnthropicOpenAI
发布时间2026-04-072026-03-05
模型类型聊天大模型多模态大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度暂无数据1M
最大输出8K125K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项Claude Mythos PreviewGPT-5.4 Pro
文本输入$25 / 1M tokens$30 / 1M tokens
文本输出$125 / 1M tokens$180 / 1M tokens

小结

  • Claude Mythos Preview在以下类目领先:General Knowledge (2/2)
  • GPT-5.4 Pro在以下类目领先:AI Agent - Information Search (1/1)

3 个共同 benchmark 上,Claude Mythos Preview 平均高出 0.60 分。

单项差距最大的 benchmark:HLE — Claude Mythos Preview 64.70,GPT-5.4 Pro 58.70(分差 +6)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。