评测结果
Claude Fable 5
评测结果
编程与软件工程
共 3 项评测评测名称 / 模式
得分
排名/总数
AI Agent - 工具使用
共 4 项评测评测名称 / 模式
得分
排名/总数
竞品对比
Claude Fable 5 与同类主流模型的评测得分对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;百分制评测使用原始高度,超出 0-100 的评测按该评测内相对比例缩放,标签仍保留原始分数。
4 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。
| 评测项 | Claude Fable 5当前 | GPT-5.5 | Gemini 3.1 Pro Preview | DeepSeek-V4-Pro |
|---|---|---|---|---|
HLE 综合评估 | 59.00深度思考模式 | 52.20思考水平·高 | 工具 | 51.40思考水平·高 | 工具 | 48.20思考水平·极高 | 工具 |
SWE-Bench Pro - Public 编程与软件工程 | 80.30深度思考模式 | 工具 | 58.60思考水平·高 | 工具 | 54.20思考水平·高 | 工具 | 55.40思考水平·极高 | 工具 |
SWE-bench Verified 编程与软件工程 | 95.00思考水平·高 | 工具 | -- | 80.60思考水平·高 | 工具 | 80.60思考水平·极高 | 工具 |
OSWorld-Verified AI Agent - 工具使用 | 85.00思考水平·高 | 工具 | 78.70思考水平·高 | 工具 | -- | -- |
Claude Fable 5 与同类模型的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。 · USD / 1M tokens
若存在上下文阈值,图中标准价仅适用于以下范围:
Gemini 3.1 Pro Preview: 标准价适用于 <= 200K
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Claude Fable 5 | Anthropic | $10 / 1M tokens | $50 / 1M tokens | — |
GPT-5.5 | OpenAI | $5 / 1M tokens | $30 / 1M tokens | — |
Gemini 3.1 Pro Preview | Google Deep Mind | $2 / 1M tokens | $12 / 1M tokens | <= 200K |
DeepSeek-V4-Pro | DeepSeek-AI | $0.435 / 1M tokens | $0.87 / 1M tokens | — |