OpenAI o1-mini
OpenAI o1-mini 是由 OpenAI 发布的 AI 模型,发布时间为 2024-09-12,定位为 推理大模型,上下文长度为 128K,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(49 / 116,得分 80.30)、MMLU(39 / 64,得分 85.20)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
OpenAI于2024年9月12日推出了o1-mini模型,这是一款专为STEM领域(科学、技术、工程和数学)设计的高性价比推理模型。作为o1-preview模型的经济高效替代方案,o1-mini在多个评估基准上表现出色。
主要特点:
基准测试表现:
技术规格:
安全性与一致性:
o1-mini采用与o1-preview相同的对齐和安全技术。内部评估显示,与GPT-4o相比,o1-mini对越狱尝试的抵抗力提高了59%,确保遵守安全指南,降低生成有害内容的风险。
局限性:
尽管o1-mini在STEM相关任务中表现出色,但其世界知识范围比o1-preview等更大的模型要窄。这意味着在需要广泛事实信息的任务中,o1-mini可能不如这些更大的模型适用。
总的来说,OpenAI的o1-mini在性能和成本之间实现了良好平衡,是专注于STEM推理任务的应用的理想选择。其优化设计确保在其专业领域内高效处理任务,同时保持输出质量。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
