面向数学、逻辑、Agent 工具调用等复杂推理任务做强化学习训练的大模型。
推理大模型(Reasoning Model)通过 chain-of-thought 训练或推理阶段扩展思考预算,在 AIME、FrontierMath、ARC-AGI、GPQA 等高难度推理基准上有显著提升。代表模型包括 OpenAI o 系列、DeepSeek-R1、Claude Extended Thinking 等。下方汇总各推理模型在主流推理基准上的成绩与 API 价格。
支持按类型、规模、授权、发布机构等条件组合筛选
收录 0 款模型
正在获取模型数据...