DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GPT-4o(2024-11-20)
GP

GPT-4o(2024-11-20)

聊天大模型

GPT-4o(2024-11-20)

发布时间: 2024-11-20更新于: 2025-02-11 14:25:57926
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128K
中文支持
支持
推理能力

GPT-4o(2024-11-20) 是由 OpenAI 发布的 AI 模型,发布时间为 2024-11-20,定位为 聊天大模型,上下文长度为 128K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-4o(2024-11-20)

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
发布时间
2024-11-20
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
GPT-4o(2024-11-20)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
GPT-4o(2024-11-20)

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
GPT-4o(2024-11-20)

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
GPT-4o(2024-11-20)

评测结果

GPT-4o(2024-11-20) 当前已收录的代表性评测结果包括 HumanEval(7 / 39,得分 90.20)、SimpleQA(19 / 45,得分 38.80)、MMLU Pro(70 / 124,得分 77.90)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
MMLU
常规模式
85.70
37 / 65
MMLU Pro
常规模式
77.90
70 / 124

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
HumanEval
常规模式
90.20
7 / 39
SWE-bench Verified
常规模式
31
98 / 103

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
MATH
常规模式
68.50
24 / 42
FrontierMath
常规模式
0.30
54 / 57

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
常规模式
38.80
19 / 45
查看评测深度分析与其他模型对比
GPT-4o(2024-11-20)

发布机构

OpenAI
OpenAI
查看发布机构详情
GPT-4o(2024-11-20)

模型解读

OpenAI在2024年11月20日发布的GPT-4o更新版本。


GPT-4o-2024-11-20 的新功能包括:

  • 创意写作能力: 这个版本提升了其创意写作能力,提供更自然、引人入胜且量身定制的写作内容,提高了相关性和可读性。
  • 文件处理: 它在处理上传文件方面表现更好,能够提供更深入的洞察和更全面的响应。
  • 性能和功能:它支持128K个令牌的上下文窗口,每次请求可生成多达16.4K个令牌。模型的实证生成速度为每秒77.4个令牌。保持成本效益,输入费用为每百万令牌2.50美元,输出费用为每百万令牌10美元。
  • API可用性: 该模型通过OpenAI的API可用,允许开发者将其能力集成到他们的应用程序中。
  • 基准测试表现: 虽然在某些基准测试如MMLU、GPQA、MATH和SimpleQA上得分较低,但创意写作任务有显著提升,这表明在创造性与严格事实准确性之间可能存在某种平衡。
  • 用户反馈: 在Reddit和Microsoft Q&A等平台上的讨论中,用户提到了模型在创意写作方面的改进以及通过API使用该版本的可能性,尽管一些用户注意到在Azure OpenAI Assistants中某些功能的支持缺失。

这些更新旨在使模型在需要创意写作和详细文档分析的场景中变得更加多功能和引人入胜。然而,对于需要高事实准确性或特定推理能力的任务,用户可能需要考虑上下文或可能查看其他专用模型,如o1用于推理任务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码