DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Back to benchmark list
  2. /
  3. Creative Writing

Creative Writing 评测基准详情

Creative Writing v3 是一个用于评估大型语言模型(LLM)创意写作能力的评测基准。该基准采用混合评分系统,旨在更精确地区分不同模型,特别是顶尖模型之间的性能差异。

更新2025-11-28
Views835
问题数量
32
发布机构
个人
评测类别
写作和创作
评测指标
人工评估
支持语言
英文
难度等级
中等难度

简介

用顶尖大模型来判断大模型创意写作方面的评测基准

相关资源

查看原始论文
阅读学术论文原文
获取数据集
下载评测数据集
访问官网
浏览项目官方网站
DataLearner 介绍
中文详细解读

Creative Writing Model Score Leaderboard

Source: DataLearnerAI

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

模式说明:
normal
thinking
low
medium
high
deeper thinking
parallel_thinking
图表加载中...

详细评测数据

No parallel thinking results available

Creative Writing详细排名数据表格

排名模型
1
Kimi K2default
88.12025-07-1110000
2
OpenAI o3default
87.652025-04-16未知
3
Qwen3-235B-A22B-2507default
87.52025-07-212350
4
DeepSeek-R1-0528default
86.252025-05-286710
5
Qwen3-235B-A22B-Thinking-2507default
86.12025-07-252350
6
Qwen3-235B-A22B-Thinkingdefault
86.12025-07-30305
7
Qwen3-30B-A3B-2507default
862025-07-29305
8
Gemini 2.5-Prodefault
85.852025-06-05未知
9
Qwen3-Nextdefault
85.32025-09-11800
10
GPT-4o(2025-03-27)default
84.92025-03-27未知
11
DeepSeek-R1default
84.62025-01-206710
12
Qwen3-235B-A22Bdefault
84.62025-04-282350
13
Claude Opus 4default
83.752025-05-23未知
14
Claude Sonnet 4default
83.052025-05-23未知
15
DeepSeek-V3default
81.62024-12-266810
16
DeepSeek-V3-0324default
81.62025-03-246710
17
Qwen3-32Bdefault
812025-04-28320
18
Qwen3-235B-A22Bdefault
80.42025-04-282350
19
Claude 3.5 Sonnet Newdefault
78.152024-10-22未知
20
Qwen3-8Bdefault
752025-04-2880
21
Qwen3-30B-A3Bdefault
68.12025-04-28305
22
Qwen3-8Bdefault
64.52025-04-2880