DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
评测总览Text Generation Arena 文本生成模型排行榜

LMArena 评测赛道

Text GenerationImage EditText-to-VideoImage-to-VideoText-to-Image

Text Generation Arena 文本生成模型排行榜

基于 Text Generation Arena 用户匿名投票的最新AI文本生成模型排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。

榜首模型

claude-opus-4-6-thinking

最高得分

1,507

模型数量

60

数据版本

2026年02月16日

数据来源: LM Arena

关于本排行榜

本排行榜展示了当前最强 AI 大模型在文本生成任务中的综合实力排名。数据来源于 LMArena(前身为 LMSYS Chatbot Arena),这是目前全球最大的 AI 模型众包评测平台。用户在平台上与两个匿名模型同时对话,并投票选出更好的回答——排名完全由真实用户的偏好决定,而非实验室基准测试。

评测方法概要

匿名盲测:用户同时与两个"隐藏身份"的模型对话,根据回答质量投票,排除品牌偏见。

Elo 评分:基于国际象棋领域的 Elo Rating 体系(Bradley-Terry 模型),通过对战结果计算每个模型的实力分数。分数越高,说明模型在真实对话中被用户选中的概率越大。

场景覆盖广泛:涵盖编程、创意写作、数学推理、知识问答、角色扮演等高频真实场景。

DataLearner 在原始数据基础上提供中文解读与深度分析,并将排行榜模型关联至 DataLearner 模型库,方便您一键查看模型详情、API 定价、评测得分等完整信息。

文本生成 Elo 分数排名

Top 10

图表来源:DataLearnerAI · 数据来源:LMArena

排名总表

排名模型名称得分95% CI投票数机构许可证
1claude-opus-4-6-thinking1,507+94,650AnthropicProprietary
2claude-opus-4-61,504+85,427AnthropicProprietary
3gemini-3-pro1,486+436,238GoogleProprietary
4grok-4.1-thinking1,475+435,770xAIProprietary
5gemini-3-flash1,473+526,986GoogleProprietary
6dola-seed-2.0-preview1,473+103,154BytedanceProprietary
7claude-opus-4-5-20251101-thinking-32k1,471+528,374AnthropicProprietary
8claude-opus-4-5-202511011,467+433,214AnthropicProprietary
9grok-4.11,463+439,883xAIProprietary
10gemini-3-flash (thinking-minimal)1,462+518,355GoogleProprietary
11gpt-5.1-high1,458+432,297OpenAIProprietary
12glm-51,455+94,643ZaiMIT
13ernie-5.0-01101,453+611,982BaiduProprietary
14claude-sonnet-4-5-20250929-thinking-32k1,450+446,773AnthropicProprietary
15claude-sonnet-4-5-202509291,450+444,565AnthropicProprietary
16gemini-2.5-pro1,449+395,526GoogleProprietary
17ernie-5.0-preview-12031,449+79,744BaiduProprietary
18claude-opus-4-1-20250805-thinking-16k1,449+449,819AnthropicProprietary
19kimi-k2.5-thinking1,448+79,050MoonshotModified MIT
20claude-opus-4-1-202508051,445+375,773AnthropicProprietary
21gpt-4.5-preview-2025-02-271,444+614,549OpenAIProprietary
22chatgpt-4o-latest-202503261,442+383,193OpenAIProprietary
23glm-4.71,441+611,971ZaiMIT
24gpt-5.2-high1,438+617,088OpenAIProprietary
25kimi-k2.5-instant1,438+95,007MoonshotModified MIT
26gpt-5.21,438+613,795OpenAIProprietary
27gpt-5.11,437+434,522OpenAIProprietary
28gpt-5-high1,434+532,559OpenAIProprietary
29qwen3-max-preview1,434+527,763AlibabaProprietary
30o3-2025-04-161,432+461,272OpenAIProprietary
31grok-4.1-fast-reasoning1,431+429,040xAIProprietary
32kimi-k2-thinking-turbo1,429+434,127MoonshotModified MIT
33gpt-5-chat1,426+431,753OpenAIProprietary
34glm-4.61,425+435,242ZaiMIT
35qwen3-max-2025-09-231,425+69,203AlibabaProprietary
36claude-opus-4-20250514-thinking-16k1,424+437,930AnthropicProprietary
37deepseek-v3.2-exp-thinking1,423+78,981DeepSeekMIT
38deepseek-v3.2-exp1,423+611,721DeepSeekMIT
39qwen3-235b-a22b-instruct-25071,423+369,847AlibabaApache 2.0
40grok-4-fast-chat1,422+86,983xAIProprietary
41deepseek-v3.2-thinking1,420+523,731DeepSeekMIT
42deepseek-v3.21,420+528,747DeepSeekMIT
43deepseek-r1-05281,419+619,281DeepSeekMIT
44ernie-5.0-preview-10221,419+94,594BaiduProprietary
45deepseek-v3.11,418+615,269DeepSeekMIT
46kimi-k2-0905-preview1,417+611,959MoonshotModified MIT
47deepseek-v3.1-thinking1,417+711,963DeepSeekMIT
48kimi-k2-0711-preview1,417+528,632MoonshotModified MIT
49deepseek-v3.1-terminus1,416+103,757DeepSeekMIT
50deepseek-v3.1-terminus-thinking1,416+103,547DeepSeekMIT
51qwen3-vl-235b-a22b-instruct1,415+611,653AlibabaApache 2.0
52mistral-large-31,414+524,945MistralApache 2.0
53gpt-4.1-2025-04-141,413+452,121OpenAIProprietary
54claude-opus-4-202505141,413+445,522AnthropicProprietary
55mistral-medium-25081,411+363,710MistralProprietary
56grok-3-preview-02-241,411+433,966xAIProprietary
57gemini-2.5-flash1,411+394,795GoogleProprietary
58glm-4.51,410+524,751ZaiMIT
59grok-4-07091,410+441,993xAIProprietary
60claude-haiku-4-5-202510011,406+445,273AnthropicProprietary

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。