DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜Text Generation Arena 文本生成模型排行榜

LMArena 评测赛道

文本生成图像编辑文字生成视频图生视频文生图

Text Generation Arena 文本生成模型排行榜

基于 Text Generation Arena 用户匿名投票的最新AI文本生成模型排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

GPT-5.5 (xhigh)

最高得分

60

模型数量

200

数据版本

2026年04月24日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前最强 AI 大模型在文本生成任务中的综合实力排名。数据来源于 LMArena(前身为 LMSYS Chatbot Arena),这是目前全球最大的 AI 模型众包评测平台。用户在平台上与两个匿名模型同时对话,并投票选出更好的回答——排名完全由真实用户的偏好决定,而非实验室基准测试。

评测方法概要

匿名盲测:用户同时与两个"隐藏身份"的模型对话,根据回答质量投票,排除品牌偏见。

Elo 评分:基于国际象棋领域的 Elo Rating 体系(Bradley-Terry 模型),通过对战结果计算每个模型的实力分数。分数越高,说明模型在真实对话中被用户选中的概率越大。

场景覆盖广泛:涵盖编程、创意写作、数学推理、知识问答、角色扮演等高频真实场景。

DataLearner 在原始数据基础上提供中文解读与深度分析,并将排行榜模型关联至 DataLearner 模型库,方便您一键查看模型详情、API 定价、评测得分等完整信息。

筛选条件

榜单历史快照月份:

排名总表

排名模型名称得分95% CI投票数机构许可证
1GPT-5.5 (xhigh)60//OpenAI/
2GPT-5.5 (high)59//OpenAI/
3Claude Opus 4.7 (max)57//Anthropic/
4Gemini 3.1 Pro Preview57//Google Deep Mind/
5GPT-5.457//OpenAI/
6GPT-5.5 (medium)57//OpenAI/
7Kimi K2.654//Kimi/
8MiMo-V2.5-Pro54//Xiaomi/
9GPT-5.3 Codex54//OpenAI/
10Muse Spark52//Facebook AI研究实验室/
11Claude Opus 4.7 (Non-reasoning, high)52//Anthropic/
12Qwen3.6 Max Preview52//Alibaba/
13Claude Sonnet 4.652//Anthropic/
14GLM 5.151//智谱AI/
15GPT-5.5 (low)51//OpenAI/
16Qwen 3.6 Plus Preview50//阿里巴巴/
17GLM-550//智谱AI/
18MiniMax-M2.750//MiniMax/
19Grok 4.20 0309 v249//xAI/
20MiMo-V2-Pro49//Xiaomi/
21GPT-5.4 mini49//OpenAI/
22GLM-5-Turbo47//智谱AI/
23DeepSeek V4 Flash (Max)47//DeepSeek/
24Gemini 3.0 Flash46//Google Deep Mind/
25Qwen3.6 27B46//Alibaba/
26Qwen3.5-397B-A17B45//阿里巴巴/
27Nova 2 Omni(Preview)45//亚马逊/
28DeepSeek V4 Flash (High)45//DeepSeek/
29Claude Sonnet 4.644//Anthropic/
30GPT-5.4 nano44//OpenAI/
31GLM 5.144//智谱AI/
32Qwen3.6 35B A3B43//Alibaba/
33MiMo-V2-Omni43//Xiaomi/
34GLM-5V-Turbo43//智谱AI/
35Claude Sonnet 4.643//Anthropic/
36DeepSeek V3.242//DeepSeek-AI/
37Qwen3.5-122B-A10B42//阿里巴巴/
38Gemini 2.0 Flash Experimental41//DeepMind/
39Gemini 3.1 Pro Preview41//Google Deep Mind/
40GPT-5.5 (Non-reasoning)41//OpenAI/
41GLM-541//智谱AI/
42Qwen3.5-397B-A17B40//阿里巴巴/
43Gemma 4 31B39//Google/
44Qwen3.5-Omni-Plus39//阿里巴巴/
45Grok 4.1 Fast39//xAI/
46Step 3.5 Flash38//StepFunAI/
47OpenAI o338//OpenAI/
48GPT-5.4 nano38//OpenAI/
49GPT-5.4 mini38//OpenAI/
50Kimi K2.537//Moonshot AI/
51Haiku 4.537//Anthropic/
52NVIDIA Nemotron 3 Super36//NVIDIA/
53Qwen3.5-122B-A10B36//阿里巴巴/
54Nova 2 Pro(Preview)36//亚马逊/
55GPT-5.4 (Non-reasoning)35//OpenAI/
56Gemini 3.0 Flash35//Google Deep Mind/
57Gemini 2.5-Pro35//Google Deep Mind/
58Nova 2 Lite35//亚马逊/
59Ling-2.6-1T34//InclusionAI/
60Gemini 3.1 Flash-Lite Preview34//Google/
61Doubao Seed Code34//ByteDance Seed/
62GPT OSS 120B33//OpenAI/
63Mercury 233//Inception/
64Qwen3.5-9B-Instruct32//阿里巴巴/
65Gemma 4 31B32//Google/
66K-EXAONE32//LG AI Research/
67DeepSeek V3.232//DeepSeek-AI/
68Grok-3 mini - Reasoning32//xAI/
69Nova 2 Pro(Preview)32//亚马逊/
70Trinity Large Thinking32//Arcee AI/
71Qwen3.6 35B A3B32//Alibaba/
72Gemma 4 26B A4B31//Google/
73Haiku 4.531//Anthropic/
74Qwen3.5-35B-A3B31//阿里巴巴/
75MiMo-V2-Flash30//Xiaomi/
76Nova 2 Lite30//亚马逊/
77DeepSeek V3.2 Speciale29//DeepSeek-AI/
78ERNIE 5.029//百度/
79Grok 4.20 0309 v229//xAI/
80Grok Code Fast 129//xAI/
81Nemotron Cascade 2 30B A3B28//NVIDIA/
82Qwen3-Coder-Next28//阿里巴巴/
83Nova 2 Omni(Preview)28//亚马逊/
84Mistral Small 428//Mistral/
85Qwen3.5-9B-Instruct27//阿里巴巴/
86Magistral Medium 1.227//Mistral/
87Gemma 4 26B A4B27//Google/
88Qwen3.5 4B27//Alibaba/
89DeepSeek-R1-052827//DeepSeek-AI/
90Qwen3-Next27//阿里巴巴/
91Ling 2.6 Flash26//InclusionAI/
92Solar Pro 326//Upstage/
93Qwen3.5-Omni-Flash26//阿里巴巴/
94JT-MINI25//China Mobile/
95Nova 2 Lite25//亚马逊/
96GPT OSS 20B24//OpenAI/
97GPT OSS 120B24//OpenAI/
98GPT-5.4 nano24//OpenAI/
99NVIDIA Nemotron 3 Nano24//NVIDIA/
100LongCat Flash Lite24//LongCat/
101Grok 4.1 Fast24//xAI/
102K-EXAONE23//LG AI Research/
103GPT-5.4 mini23//OpenAI/
104Nova 2 Omni(Preview)23//亚马逊/
105Nova 2 Pro(Preview)23//亚马逊/
106Mi:dm K 2.5 Pro23//Korea Telecom/
107Mistral Large 323//MistralAI/
108Ring-1T23//InclusionAI/
109Qwen3.5 4B23//Alibaba/
110INTELLECT-322//Prime Intellect/
111Devstral 222//Mistral/
112Solar Open 100B22//Upstage/
113Gemini 2.5 Flash-Lite-Preview-09-202522//Google Deep Mind/
114Mistral Medium 3.121//Mistral/
115GPT OSS 20B21//OpenAI/
116Qwen3-Next20//阿里巴巴/
117Devstral Small 219//Mistral/
118Gemini 2.5 Flash-Lite-Preview-09-202519//Google Deep Mind/
119Motif-2-12.7B19//Motif Technologies/
120Ling-1T19//InclusionAI/
121Nova Premier19//Amazon/
122Gemma 4 E4B19//Google/
123Llama Nemotron Super 49B v1.519//NVIDIA/
124Mistral Small 419//Mistral/
125Llama 3.3 Nemotron Super 49B18//NVIDIA/
126Llama 4 Maverick18//Facebook AI研究实验室/
127Magistral Small 1.218//Mistral/
128Sarvam 105B (high)18//Sarvam/
129Nova 2 Lite18//亚马逊/
130Llama3.1-405B17//Facebook AI研究实验室/
131EXAONE 4.0 32B17//LG AI Research/
132Nova 2 Omni(Preview)17//亚马逊/
133Qwen3.5 2B16//Alibaba/
134Nanbeige4.1-3B16//Nanbeige/
135Ministral 3 14B16//MistralAI/
136DeepSeek-R1-Distill-Llama-70B16//DeepSeek-AI/
137Falcon-H1R-7B16//TII UAE/
138Ling-flash-2.016//InclusionAI/
139Qwen3-Omni-30B-A3B16//阿里巴巴/
140Step3 VL 10B15//StepFun/
141Gemma 4 E2B15//Google/
142Llama Nemotron Ultra15//NVIDIA/
143ERNIE-4.5-300B-A47B15//百度/
144Solar Pro 215//Upstage/
145NVIDIA Nemotron Nano 12B v2 VL15//NVIDIA/
146Ministral 3 8B15//MistralAI/
147Gemma 4 E4B15//Google/
148NVIDIA Nemotron Nano 9B V215//NVIDIA/
149NVIDIA Nemotron 3 Nano 4B15//NVIDIA/
150Qwen3.5 2B15//Alibaba/
151Llama Nemotron Super 49B v1.515//NVIDIA/
152Llama3.3-70B-Instruct14//Facebook AI研究实验室/
153Llama 3.1 Nemotron Nano 4B v1.114//NVIDIA/
154Kimi Linear 48B A3B Instruct14//Kimi/
155Llama 3.3 Nemotron Super 49B14//NVIDIA/
156Ring-flash-2.014//InclusionAI/
157Solar Pro 214//Upstage/
158Llama 4 Scout14//Facebook AI研究实验室/
159C4AI Command A (202503)13//CohereAI/
160Llama 3.1 Nemotron 70B13//NVIDIA/
161NVIDIA Nemotron 3 Nano13//NVIDIA/
162NVIDIA Nemotron Nano 9B V213//NVIDIA/
163Sarvam 30B (high)12//Sarvam/
164Gemma 4 E2B12//Google/
165R1 177612//Perplexity/
166Llama 3.2-Vision-90B12//Facebook AI研究实验室/
167EXAONE 4.0 32B12//LG AI Research/
168Ministral 3 3B11//Mistral/
169Jamba 1.7 Large11//AI21 Labs/
170Granite 4.0 H Small11//IBM/
171Qwen3-Omni-30B-A3B11//阿里巴巴/
172Qwen3.5 0.8B11//Alibaba/
173LFM2 24B A2B10//Liquid AI/
174Phi 4 - 14B10//Microsoft Azure/
175Amazon Nova Micro10//亚马逊/
176NVIDIA Nemotron Nano 12B v2 VL10//NVIDIA/
177Phi-4-multimodal-instruct 10//Microsoft Azure/
178Qwen3.5 0.8B10//Alibaba/
179Jamba Reasoning 3B10//AI21 Labs/
180Gemini 3.0 Flash10//Google Deep Mind/
181Ling-mini-2.09//InclusionAI/
182Llama 3.2-Vision-11B9//Facebook AI研究实验室/
183Phi-4-mini-instruct (3.8B)8//Microsoft Azure/
184Exaone 4.0 1.2B8//LG AI Research/
185Exaone 4.0 1.2B8//LG AI Research/
186LFM2.5-1.2B-Thinking8//Liquid AI/
187Jamba 1.7 Mini8//AI21 Labs/
188LFM2.5-1.2B-Instruct8//Liquid AI/
189LFM2 2.6B8//Liquid AI/
190Granite 4.0 H 1B8//IBM/
191Gemma 3-270M8//Google Deep Mind/
192Apertus 70B Instruct8//Swiss AI Initiative/
193Granite 4.0 Micro8//IBM/
194Granite 4.0 1B7//IBM/
195LFM2 8B A1B7//Liquid AI/
196LFM2.5-VL-1.6B6//Liquid AI/
197Granite 4.0 350M6//IBM/
198Apertus 8B Instruct6//Swiss AI Initiative/
199Granite 4.0 H 350M5//IBM/
200Tiny Aya Global5//Cohere/

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。