DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜Text Generation Arena 文本生成模型排行榜

LMArena 评测赛道

文本生成图像编辑文字生成视频图生视频文生图

Text Generation Arena 文本生成模型排行榜

基于 Text Generation Arena 用户匿名投票的最新AI文本生成模型排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

Claude Opus 4.7 (max)

最高得分

57

模型数量

201

数据版本

2026年04月23日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前最强 AI 大模型在文本生成任务中的综合实力排名。数据来源于 LMArena(前身为 LMSYS Chatbot Arena),这是目前全球最大的 AI 模型众包评测平台。用户在平台上与两个匿名模型同时对话,并投票选出更好的回答——排名完全由真实用户的偏好决定,而非实验室基准测试。

评测方法概要

匿名盲测:用户同时与两个"隐藏身份"的模型对话,根据回答质量投票,排除品牌偏见。

Elo 评分:基于国际象棋领域的 Elo Rating 体系(Bradley-Terry 模型),通过对战结果计算每个模型的实力分数。分数越高,说明模型在真实对话中被用户选中的概率越大。

场景覆盖广泛:涵盖编程、创意写作、数学推理、知识问答、角色扮演等高频真实场景。

DataLearner 在原始数据基础上提供中文解读与深度分析,并将排行榜模型关联至 DataLearner 模型库,方便您一键查看模型详情、API 定价、评测得分等完整信息。

筛选条件

榜单历史快照月份:

排名总表

排名模型名称得分95% CI投票数机构许可证
1Claude Opus 4.7 (max)57//Anthropic/
2Gemini 3.1 Pro Preview57//Google Deep Mind/
3GPT-5.457//OpenAI/
4Kimi K2.654//Kimi/
5MiMo-V2.5-Pro54//Xiaomi/
6GPT-5.3 Codex54//OpenAI/
7Claude Opus 4.653//Anthropic/
8Muse Spark52//Facebook AI研究实验室/
9Claude Opus 4.7 (Non-reasoning, high)52//Anthropic/
10Qwen3.6 Max Preview52//Alibaba/
11Claude Sonnet 4.652//Anthropic/
12GLM 5.151//智谱AI/
13Qwen 3.6 Plus Preview50//阿里巴巴/
14GLM-550//智谱AI/
15MiniMax-M2.750//MiniMax/
16Grok 4.20 0309 v249//xAI/
17MiMo-V2-Pro49//Xiaomi/
18GPT-5.4 mini49//OpenAI/
19Kimi K2.547//Moonshot AI/
20GLM-5-Turbo47//智谱AI/
21Claude Opus 4.6 (high)46//Anthropic/
22Gemini 3.0 Flash46//Google Deep Mind/
23Qwen3.5-397B-A17B45//阿里巴巴/
24Nova 2 Omni(Preview)45//亚马逊/
25Claude Sonnet 4.644//Anthropic/
26GPT-5.4 nano44//OpenAI/
27GLM 5.144//智谱AI/
28Qwen3.6 35B A3B43//Alibaba/
29MiMo-V2-Omni43//Xiaomi/
30GLM-5V-Turbo43//智谱AI/
31Claude Sonnet 4.643//Anthropic/
32Qwen3.5-27B42//阿里巴巴/
33DeepSeek V3.242//DeepSeek-AI/
34Qwen3.5-122B-A10B42//阿里巴巴/
35Gemini 2.0 Flash Experimental41//DeepMind/
36Gemini 3.1 Pro Preview41//Google Deep Mind/
37GLM-541//智谱AI/
38Qwen3.5-397B-A17B40//阿里巴巴/
39Qwen3-Max-Thinking40//阿里巴巴/
40Gemma 4 31B39//Google/
41Qwen3.5-Omni-Plus39//阿里巴巴/
42Grok 4.1 Fast39//xAI/
43Step 3.5 Flash38//StepFunAI/
44OpenAI o338//OpenAI/
45GPT-5.4 nano38//OpenAI/
46Step 3.5 Flash38//StepFunAI/
47GPT-5.4 mini38//OpenAI/
48Kimi K2.537//Moonshot AI/
49Qwen3.5-27B37//阿里巴巴/
50Qwen3.5-35B-A3B37//阿里巴巴/
51Haiku 4.537//Anthropic/
52NVIDIA Nemotron 3 Super36//NVIDIA/
53Qwen3.5-122B-A10B36//阿里巴巴/
54Nova 2 Pro(Preview)36//亚马逊/
55GPT-5.4 (Non-reasoning)35//OpenAI/
56Gemini 3.0 Flash35//Google Deep Mind/
57Gemini 2.5-Pro35//Google Deep Mind/
58Nova 2 Lite35//亚马逊/
59Gemini 3.1 Flash-Lite Preview34//Google/
60Doubao Seed Code34//ByteDance Seed/
61GPT OSS 120B33//OpenAI/
62Mercury 233//Inception/
63Qwen3.5-9B-Instruct32//阿里巴巴/
64Gemma 4 31B32//Google/
65K-EXAONE32//LG AI Research/
66DeepSeek V3.232//DeepSeek-AI/
67Grok-3 mini - Reasoning32//xAI/
68Nova 2 Pro(Preview)32//亚马逊/
69Trinity Large Thinking32//Arcee AI/
70Qwen3.6 35B A3B32//Alibaba/
71Gemma 4 26B A4B31//Google/
72Haiku 4.531//Anthropic/
73Qwen3.5-35B-A3B31//阿里巴巴/
74MiMo-V2-Flash30//Xiaomi/
75Nova 2 Lite30//亚马逊/
76DeepSeek V3.2 Speciale29//DeepSeek-AI/
77ERNIE 5.029//百度/
78Grok 4.20 0309 v229//xAI/
79Grok Code Fast 129//xAI/
80Nemotron Cascade 2 30B A3B28//NVIDIA/
81Qwen3-Coder-Next28//阿里巴巴/
82Nova 2 Omni(Preview)28//亚马逊/
83Mistral Small 428//Mistral/
84Qwen3.5-9B-Instruct27//阿里巴巴/
85Magistral Medium 1.227//Mistral/
86Gemma 4 26B A4B27//Google/
87Qwen3.5 4B27//Alibaba/
88DeepSeek-R1-052827//DeepSeek-AI/
89Qwen3-Next27//阿里巴巴/
90Ling 2.6 Flash26//InclusionAI/
91Solar Pro 326//Upstage/
92Qwen3.5-Omni-Flash26//阿里巴巴/
93JT-MINI25//China Mobile/
94Qwen3-Coder-480B-A35B25//阿里巴巴/
95Nova 2 Lite25//亚马逊/
96GPT OSS 20B24//OpenAI/
97GPT OSS 120B24//OpenAI/
98GPT-5.4 nano24//OpenAI/
99NVIDIA Nemotron 3 Nano24//NVIDIA/
100LongCat Flash Lite24//LongCat/
101Grok 4.1 Fast24//xAI/
102K-EXAONE23//LG AI Research/
103GPT-5.4 mini23//OpenAI/
104Nova 2 Omni(Preview)23//亚马逊/
105Nova 2 Pro(Preview)23//亚马逊/
106Mi:dm K 2.5 Pro23//Korea Telecom/
107Mistral Large 323//MistralAI/
108Ring-1T23//InclusionAI/
109Qwen3.5 4B23//Alibaba/
110INTELLECT-322//Prime Intellect/
111Devstral 222//Mistral/
112Solar Open 100B22//Upstage/
113Gemini 2.5 Flash-Lite-Preview-09-202522//Google Deep Mind/
114Mistral Medium 3.121//Mistral/
115GPT OSS 20B21//OpenAI/
116Qwen3-Next20//阿里巴巴/
117Devstral Small 219//Mistral/
118Gemini 2.5 Flash-Lite-Preview-09-202519//Google Deep Mind/
119Motif-2-12.7B19//Motif Technologies/
120Ling-1T19//InclusionAI/
121Nova Premier19//Amazon/
122Gemma 4 E4B19//Google/
123Llama Nemotron Super 49B v1.519//NVIDIA/
124Mistral Small 419//Mistral/
125Llama 3.3 Nemotron Super 49B18//NVIDIA/
126Llama 4 Maverick18//Facebook AI研究实验室/
127Sarvam 105B (high)18//Sarvam/
128Magistral Small 1.218//Mistral/
129Nova 2 Lite18//亚马逊/
130Llama3.1-405B17//Facebook AI研究实验室/
131EXAONE 4.0 32B17//LG AI Research/
132Nova 2 Omni(Preview)17//亚马逊/
133DeepSeek-R1-0528-Qwen3-8B16//DeepSeek-AI/
134Qwen3.5 2B16//Alibaba/
135Nanbeige4.1-3B16//Nanbeige/
136Ministral 3 14B16//MistralAI/
137DeepSeek-R1-Distill-Llama-70B16//DeepSeek-AI/
138Falcon-H1R-7B16//TII UAE/
139Ling-flash-2.016//InclusionAI/
140Qwen3-Omni-30B-A3B16//阿里巴巴/
141Step3 VL 10B15//StepFun/
142Gemma 4 E2B15//Google/
143Llama Nemotron Ultra15//NVIDIA/
144ERNIE-4.5-300B-A47B15//百度/
145Solar Pro 215//Upstage/
146NVIDIA Nemotron Nano 12B v2 VL15//NVIDIA/
147Ministral 3 8B15//MistralAI/
148Gemma 4 E4B15//Google/
149NVIDIA Nemotron Nano 9B V215//NVIDIA/
150NVIDIA Nemotron 3 Nano 4B15//NVIDIA/
151Qwen3.5 2B15//Alibaba/
152Llama Nemotron Super 49B v1.515//NVIDIA/
153Llama3.3-70B-Instruct14//Facebook AI研究实验室/
154Llama 3.1 Nemotron Nano 4B v1.114//NVIDIA/
155Kimi Linear 48B A3B Instruct14//Kimi/
156Llama 3.3 Nemotron Super 49B14//NVIDIA/
157Ring-flash-2.014//InclusionAI/
158Solar Pro 214//Upstage/
159Llama 4 Scout14//Facebook AI研究实验室/
160C4AI Command A (202503)13//CohereAI/
161Llama 3.1 Nemotron 70B13//NVIDIA/
162NVIDIA Nemotron 3 Nano13//NVIDIA/
163NVIDIA Nemotron Nano 9B V213//NVIDIA/
164Sarvam 30B (high)12//Sarvam/
165Gemma 4 E2B12//Google/
166R1 177612//Perplexity/
167Llama 3.2-Vision-90B12//Facebook AI研究实验室/
168EXAONE 4.0 32B12//LG AI Research/
169Ministral 3 3B11//Mistral/
170Jamba 1.7 Large11//AI21 Labs/
171Granite 4.0 H Small11//IBM/
172Qwen3-Omni-30B-A3B11//阿里巴巴/
173Qwen3.5 0.8B11//Alibaba/
174LFM2 24B A2B10//Liquid AI/
175Phi 4 - 14B10//Microsoft Azure/
176Amazon Nova Micro10//亚马逊/
177NVIDIA Nemotron Nano 12B v2 VL10//NVIDIA/
178Phi-4-multimodal-instruct 10//Microsoft Azure/
179Qwen3.5 0.8B10//Alibaba/
180Jamba Reasoning 3B10//AI21 Labs/
181Gemini 3.0 Flash10//Google Deep Mind/
182Ling-mini-2.09//InclusionAI/
183Llama 3.2-Vision-11B9//Facebook AI研究实验室/
184Phi-4-mini-instruct (3.8B)8//Microsoft Azure/
185Exaone 4.0 1.2B8//LG AI Research/
186Exaone 4.0 1.2B8//LG AI Research/
187LFM2.5-1.2B-Thinking8//Liquid AI/
188Jamba 1.7 Mini8//AI21 Labs/
189LFM2.5-1.2B-Instruct8//Liquid AI/
190LFM2 2.6B8//Liquid AI/
191Granite 4.0 H 1B8//IBM/
192Gemma 3-270M8//Google Deep Mind/
193Apertus 70B Instruct8//Swiss AI Initiative/
194Granite 4.0 Micro8//IBM/
195Granite 4.0 1B7//IBM/
196LFM2 8B A1B7//Liquid AI/
197LFM2.5-VL-1.6B6//Liquid AI/
198Granite 4.0 350M6//IBM/
199Apertus 8B Instruct6//Swiss AI Initiative/
200Granite 4.0 H 350M5//IBM/
201Tiny Aya Global5//Cohere/

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。