【辟谣,该数据是预测】重磅!疑似GPT-5评测结果泄露,超过当前所有模型评分,人类最后难题得分56.6,比当前最好模型还要高27%,大幅超过Gemini 2.5 Pro,Grok 4 Heavy等
----------更正:数据已经辟谣,来源推友预测
就在刚才,X平台出现疑似GPT-5的评测结果。结果显示,在所涉及的四项评测中,GPT-5均排名第一。

尽管OpenAI官方尚未发布明确信息,但此前有传闻称GPT-5模型或将于2025年7月发布。而流传的评测数据显示,GPT-5在四项具有挑战性的评测中均获得第一,且得分大幅领先于现有其他模型。
根据泄露的信息,此次评测包含两个不同版本的GPT-5,分别是基础版GPT-5以及一个具备增强推理能力的GPT-5 Reasoning版本。具体评测结果如下图所示:

从图表数据来看,GPT-5的表现在多方面均超越了其他模型,主要体现在以下几点:
- 各版本全面领先:在所有四个评测基准上,GPT-5的两个版本(特别是"Reasoning"版)都显著优于图表中列出的其他所有模型,包括Grok 4 Heavy、Gemini-2.5-Pro等。



