OpenAI发布GPT-4.1,本次发布的模型只有接口,仅开发者可用:大幅提升指令遵从和编程能力,最高上下文达到100万tokens!而GPT-4.5即将下架!

29 阅读

今天,OpenAI发布了3个全新的大模型,即GPT-4.1系列,本次发布的模型仅针对开发者提供接口,而不会在ChatGPT上提供。这一系列模型在编码能力、指令遵循、长上下文理解等核心领域实现了显著提升,同时引入了首个“Nano级别”的轻量化模型即GPT-4.1 Nano,此前OpenAI只有GPT-4o mini这种模型,nano比mini规模更小。

GPT-4.1系列简介

GPT-4.1包含3个不同的版本,分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano,参数规模依次递减。

GPT-4.1系列模型在很多任务领域到比GPT-4o更好,特别是编程和指令遵从方面,此外,本次升级之后的模型GPT-4.1最高支持100万tokens的上下文输入。

此外,本次升级值得注意的是mini版本模型的升级,在很多任务上,GPT-4.1 mini的水平已经达到了GPT-4o的水平,例如综合知识理解MMLU、代码评测SWE等。而成本下降83%,延迟则降低了一半。

GPT-4.1 nano是OpenAI首次引入的一类小参数规模版本的模型。速度达到了每秒292个tokens,非常快,是当前GPT-4o模型的3倍左右,而它的MMLU评分是80.1,仅仅比GPT-4o的81.4%低一点点。可以说性价十分高,官方说,GPT-4.1 nano非常适合用来做分类和补全的任务。此外,它也支持100万tokens的输入,在128K输入测试中,它首字符返回都是5秒以内,但是GPT-4.1则需要15秒。

根据官网的消息,当前最新的GPT-4o模型已经包含了GPT-4.1的能力,而经过2个月测试的GPT-4.5模型即将下架,这些信息组合在一起,似乎让人难以理解。不过本次更新的GPT-4.1模型在编程能力和指令遵从性上更好,对于开发者来说是一个好消息。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码