DataLearner Atlas

推理大模型

面向数学、逻辑、Agent 工具调用等复杂推理任务做强化学习训练的大模型。

推理大模型（Reasoning Model）通过 chain-of-thought 训练或推理阶段扩展思考预算，在 AIME、FrontierMath、ARC-AGI、GPQA 等高难度推理基准上有显著提升。代表模型包括 OpenAI o 系列、DeepSeek-R1、Claude Extended Thinking 等。下方汇总各推理模型在主流推理基准上的成绩与 API 价格。

全部模型

支持按类型、规模、授权、发布机构等条件组合筛选

模型类型:推理大模型

收录 0 款模型

正在获取模型数据...