OpenAI发布GPT-4.1，本次发布的模型只有接口，仅开发者可用：大幅提升指令遵从和编程能力，最高上下文达到100万tokens！而GPT-4.5即将下架！

今天，OpenAI发布了3个全新的大模型，即GPT-4.1系列，本次发布的模型仅针对开发者提供接口，而不会在ChatGPT上提供。这一系列模型在编码能力、指令遵循、长上下文理解等核心领域实现了显著提升，同时引入了首个“Nano级别”的轻量化模型即GPT-4.1 Nano，此前OpenAI只有GPT-4o mini这种模型，nano比mini规模更小。

GPT-4.1系列简介

GPT-4.1包含3个不同的版本，分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano，参数规模依次递减。

GPT-4.1系列模型在很多任务领域到比GPT-4o更好，特别是编程和指令遵从方面，此外，本次升级之后的模型GPT-4.1最高支持100万tokens的上下文输入。

此外，本次升级值得注意的是mini版本模型的升级，在很多任务上，GPT-4.1 mini的水平已经达到了GPT-4o的水平，例如综合知识理解MMLU、代码评测SWE等。而成本下降83%，延迟则降低了一半。

GPT-4.1 nano是OpenAI首次引入的一类小参数规模版本的模型。速度达到了每秒292个tokens，非常快，是当前GPT-4o模型的3倍左右，而它的MMLU评分是80.1，仅仅比GPT-4o的81.4%低一点点。可以说性价十分高，官方说，GPT-4.1 nano非常适合用来做分类和补全的任务。此外，它也支持100万tokens的输入，在128K输入测试中，它首字符返回都是5秒以内，但是GPT-4.1则需要15秒。

根据官网的消息，当前最新的GPT-4o模型已经包含了GPT-4.1的能力，而经过2个月测试的GPT-4.5模型即将下架，这些信息组合在一起，似乎让人难以理解。不过本次更新的GPT-4.1模型在编程能力和指令遵从性上更好，对于开发者来说是一个好消息。

OpenAI发布GPT-4.1，本次发布的模型只有接口，仅开发者可用：大幅提升指令遵从和编程能力，最高上下文达到100万tokens！而GPT-4.5即将下架！

GPT-4.1系列简介

DataLearner 官方微信

热门博客