Text-to-Video Arena AI视频生成模型排行榜
基于 Text-to-Video Arena 用户匿名投票的最新AI视频生成模型排行榜,涵盖各模型的 Elo 得分、95% 置信区间、投票量、机构与许可证。
Top Model
veo-3.1-audio-1080p
Top Score
1,381
Model Count
37
Data version
2026年03月06日
Data source: LM Arena
About This Leaderboard
This leaderboard ranks AI text-to-video models by generation quality. Data comes from LMArena's Text-to-Video Arena track, evaluated through anonymous blind testing by real users.
Methodology Overview
Blind testing: Users submit text descriptions, two anonymous models generate videos, and users vote for the better result.
Elo scoring: Based on the Bradley-Terry model. Higher scores indicate stronger user preference for that model's video output.
Diverse generation scenarios: Covers natural landscapes, human motion, creative animation, product showcases, and more.
DataLearner provides in-depth analysis on top of the raw data, linking leaderboard models to the DataLearner model database so you can quickly access model details, API pricing, benchmark scores, and more.
Video Generation Elo Score Ranking
Top 10Chart Source: DataLearnerAI · Data Source: LMArena
Ranking Table
| Rank | Model | Score | 95% CI | Votes | Organization | License |
|---|---|---|---|---|---|---|
| 1 | veo-3.1-audio-1080p | 1,381 | +/-16 | 5,537 | Proprietary | |
| 2 | veo-3.1-fast-audio-1080p | 1,378 | +/-14 | 5,743 | Proprietary | |
| 3 | veo-3.1-audio | 1,371 | +/-14 | 12,604 | Proprietary | |
| 4 | sora-2-pro | 1,367 | +/-9 | 18,963 | OpenAI | Proprietary |
| 5 | veo-3.1-fast-audio | 1,366 | +/-11 | 25,377 | Proprietary | |
| 6 | grok-imagine-video-720p | 1,358 | +/-9 | 33,739 | xAI | Proprietary |
| 7 | veo-3-fast-audio | 1,351 | +/-11 | 25,765 | Proprietary | |
| 8 | wan2.6-t2v | 1,347 | +/-17 | 6,446 | Alibaba | Proprietary |
| 9 | sora-2 | 1,342 | +/-8 | 25,157 | OpenAI | Proprietary |
| 10 | veo-3-audio | 1,341 | +/-12 | 19,331 | Proprietary | |
| 11 | wan2.5-t2v-preview | 1,268 | +/-17 | 6,079 | Alibaba | Proprietary |
| 12 | veo-3 | 1,257 | +/-11 | 15,176 | Proprietary | |
| 13 | seedance-v1.5-pro | 1,255 | +/-8 | 31,616 | Bytedance | Proprietary |
| 14 | veo-3-fast | 1,251 | +/-12 | 15,453 | Proprietary | |
| 15 | pixverse-v5.6 | 1,228 | +/-14 | 2,275 | Pixverse | Proprietary |
| 16 | kling-2.5-turbo-1080p | 1,221 | +/-17 | 2,052 | KlingAI | Proprietary |
| 17 | kling-2.6-pro | 1,219 | +/-8 | 38,740 | KlingAI | Proprietary |
| 18 | runway-gen-4.5 | 1,214 | +/-11 | 3,932 | Runway | Proprietary |
| 19 | kling-o1-pro | 1,208 | +/-27 | 1,198 | KlingAI | Proprietary |
| 20 | ray-3 | 1,204 | +/-23 | 1,057 | Luma AI | Proprietary |
| 21 | hailuo-02-pro | 1,200 | +/-12 | 9,879 | MiniMax | Proprietary |
| 22 | hailuo-2.3 | 1,196 | +/-8 | 26,762 | MiniMax | Proprietary |
| 23 | seedance-v1-pro | 1,192 | +/-11 | 12,882 | Bytedance | Proprietary |
| 24 | hailuo-02-standard | 1,181 | +/-12 | 9,931 | MiniMax | Proprietary |
| 25 | p-video | 1,180 | +/-15 | 3,589 | Pruna | Proprietary |
| 26 | kandinsky-5.0-t2v-pro | 1,179 | +/-21 | 1,886 | Kandinsky | MIT |
| 27 | hunyuan-video-1.5 | 1,171 | +/-16 | 4,097 | Tencent | tencent-hunyuan-community |
| 28 | kling-v2.1-master | 1,168 | +/-9 | 14,512 | KlingAI | Proprietary |
| 29 | veo-2 | 1,166 | +/-16 | 7,098 | Proprietary | |
| 30 | wan-v2.2-a14b | 1,130 | +/-15 | 11,158 | Alibaba | Apache 2.0 |
| 31 | ltx-2-19b | 1,122 | +/-10 | 21,120 | lightricks | ltx-2-community-license-agreement |
| 32 | seedance-v1-lite | 1,114 | +/-9 | 16,703 | Bytedance | Proprietary |
| 33 | kandinsky-5.0-t2v-lite | 1,112 | +/-18 | 1,353 | Kandinsky | MIT |
| 34 | sora | 1,071 | +/-14 | 4,516 | OpenAI | Proprietary |
| 35 | ray2 | 1,066 | +/-17 | 5,609 | Luma AI | Proprietary |
| 36 | pika-v2.2 | 1,011 | +/-15 | 6,495 | Pika | Proprietary |
| 37 | mochi-v1 | 999 | +/-16 | 6,676 | Genmo AI | Apache 2.0 |
Data is for reference only. Official sources are authoritative. Click model names to view DataLearner model profiles.
2026年3月文生视频榜单分析
最新排名亮点
本次 LMArena Text-to-Video Arena 榜单更新至 2026 年 3 月 6 日,共收录 37 个模型,累计投票约 24.7 万次。头部格局相比上个版本继续向 Google Veo 系列集中,前五名中 Google 占据四席。
Veo 3.1 系列继续统治文生视频赛道。veo-3.1-audio-1080p 以 1381 分位列第一,veo-3.1-fast-audio-1080p 以 1378 分位列第二,veo-3.1-audio 以 1371 分位列第三。高分辨率和音频增强版本依然明显强于旧版 Veo 3 / Veo 2。
OpenAI Sora 系列保持第一梯队竞争力。sora-2-pro 以 1367 分位列第 4,sora-2 以 1342 分位列第 9,初代 sora 则处于榜单后段。和 Veo 相比,Sora 在顶级版本上仍有竞争力,但整体阵容厚度略弱。
xAI Grok 继续扮演高潜力挑战者。grok-imagine-video-720p 以 1358 分排在第 6,已经进入顶级阵营边缘,说明其在视频生成质量上具备相当强的即战力。
国产模型表现
国产模型中,wan2.6-t2v 以 1347 分排名第 8,是当前文生视频榜中最强的国产模型;它明显高于 wan2.5-t2v-preview(1268 分),说明阿里在 Wan 系列上迭代有效。
字节跳动的 seedance-v1.5-pro 以 1255 分排在第 13,仍然是国产第一梯队的重要成员;seedance-v1-pro 和 seedance-v1-lite 也都保留在榜单中。快手 kling-2.6-pro、kling-o1-pro 和 kling-v2.1-master 则继续构成中段竞争力量。
MiniMax 的 hailuo-02-pro 与 hailuo-2.3 表现接近,位于 1200 分附近,稳定处于中游。腾讯的 hunyuan-video-1.5 也保持在榜,但与头部模型仍有较大差距。
开源模型表现
当前开源阵营里,wan-v2.2-a14b(Apache 2.0)仍是最值得关注的文生视频开源方案之一;mochi-v1 同样提供 Apache 2.0 许可,但分数明显落后于头部闭源模型。
MIT 许可的 kandinsky-5.0-t2v-pro 和 kandinsky-5.0-t2v-lite 仍在榜单中,但样本量偏小、排名靠后。整体看,开源文生视频模型与 Veo、Sora 及国产头部闭源模型之间仍然存在比较明显的质量差距。
2026年3月市场风向标
当前最佳 (SOTA)
Veo 3.1 Audio 1080p
Elo 1381,当前文生视频榜单第一名
Veo 3.1 Fast-Audio 1080p
Elo 1378,高速版本里表现最强
Sora-2-Pro
Elo 1367,OpenAI 当前最强文生视频模型
国产最佳
Wan2.6-T2V
Elo 1347,当前国产文生视频模型第一名
Seedance-V1.5-Pro
Elo 1255,字节跳动文生视频主力模型
Kling-2.6-Pro
Elo 1219,快手可灵系列代表模型
最佳开源模型
- •Wan-V2.2-A14BApache 2.0,当前最具代表性的开源文生视频模型之一
- •Kandinsky-5.0-T2V-ProMIT,开源阵营里分数较高
- •Mochi-V1Apache 2.0,完全开源的视频生成基础方案
排名解读(更新于 2026年03月06日)
2026年3月最好的文生视频模型是哪些?
根据 2026 年 3 月 6 日的 LMArena 文生视频榜单,Veo 3.1 Audio 1080p、Veo 3.1 Fast-Audio 1080p 和 Sora-2-Pro 是当前最强的三款模型,其中 Google Veo 系列整体优势最明显。
2026年3月最好的国产文生视频模型是哪些?
国产阵营中,Wan2.6-T2V 当前排名最高,其后是 Seedance-V1.5-Pro 和 Kling-2.6-Pro。如果看中开源可用性,Wan-V2.2-A14B 仍是重要选择。
2026年3月最好的开源文生视频模型是哪些?
从当前榜单看,Wan-V2.2-A14B、Kandinsky-5.0-T2V-Pro 和 Mochi-V1 是最主要的开源文生视频模型代表,但和头部闭源模型相比仍有明显差距。