GP

GPT-4o(2024-11-20)

聊天大模型GPTGPT-4o

GPT-4o(2024-11-20)

发布时间: 2024-11-20更新于: 2025-02-11 14:25:57948

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

128K

中文支持

支持

推理能力

GPT-4o(2024-11-20) 是由 OpenAI 发布的 AI 模型，发布时间为 2024-11-20，定位为聊天大模型，上下文长度为 128K，采用不开源许可，在 HumanEval 上取得 90.20 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GPT-4o(2024-11-20)

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

输入/输出模态

暂无数据

发布时间

2024-11-20

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

GPT-4o(2024-11-20)

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

GPT-4o(2024-11-20)

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

GPT-4o(2024-11-20)

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

GPT-4o(2024-11-20)

评测结果

GPT-4o(2024-11-20) 当前已收录的代表性评测结果包括 HumanEval（7 / 39，得分 90.20）、SimpleQA（19 / 45，得分 38.80）、MMLU（37 / 65，得分 85.70）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

85.70

37 / 65

77.90

72 / 126

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

90.20

7 / 39

SWE-bench Verified

常规模式

31

103 / 108

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

68.50

24 / 42

0.30

57 / 60

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总数

38.80

19 / 45

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

常规模式

18.20

50 / 59

查看评测深度分析与其他模型对比

和其他模型对比

想自定义其他组合？打开对比工具

GPT-4o(2024-11-20)

发布机构

OpenAI

查看发布机构详情

GPT-4o(2024-11-20)

模型解读

OpenAI在2024年11月20日发布的GPT-4o更新版本。

GPT-4o-2024-11-20 的新功能包括：

创意写作能力：这个版本提升了其创意写作能力，提供更自然、引人入胜且量身定制的写作内容，提高了相关性和可读性。
文件处理：它在处理上传文件方面表现更好，能够提供更深入的洞察和更全面的响应。
性能和功能：它支持128K个令牌的上下文窗口，每次请求可生成多达16.4K个令牌。模型的实证生成速度为每秒77.4个令牌。保持成本效益，输入费用为每百万令牌2.50美元，输出费用为每百万令牌10美元。
API可用性：该模型通过OpenAI的API可用，允许开发者将其能力集成到他们的应用程序中。
基准测试表现：虽然在某些基准测试如MMLU、GPQA、MATH和SimpleQA上得分较低，但创意写作任务有显著提升，这表明在创造性与严格事实准确性之间可能存在某种平衡。
用户反馈：在Reddit和Microsoft Q&A等平台上的讨论中，用户提到了模型在创意写作方面的改进以及通过API使用该版本的可能性，尽管一些用户注意到在Azure OpenAI Assistants中某些功能的支持缺失。

这些更新旨在使模型在需要创意写作和详细文档分析的场景中变得更加多功能和引人入胜。然而，对于需要高事实准确性或特定推理能力的任务，用户可能需要考虑上下文或可能查看其他专用模型，如o1用于推理任务。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码