Creative Writing

Creative Writing v3

用顶尖大模型来判断大模型创意写作方面的评测基准

英文 难度:中等难度

主要统计信息

问题数量

32

机构

个人

类别

知识问答

评估指标

人工评估

Creative Writing基准测试简介

Creative Writing v3 是一个用于评估大型语言模型(LLM)创意写作能力的评测基准。该基准采用混合评分系统,旨在更精确地区分不同模型,特别是顶尖模型之间的性能差异。

Creative Writing 大模型得分排行榜

冠军
亚军
季军
其他排名

详细排名数据表格

模型简称 Creative Writing得分 发布机构 发布时间 参数规模(亿)
Kimi K2 88.1 Moonshot AI Logo 2025-07-11 10000.0
OpenAI o3 87.65 OpenAI Logo 2025-04-16 未知
Gemini-2.5-Pro-Preview-06-05 85.85 Google Deep Mind Logo 2025-06-05 未知
GPT-4o(2025-03-26) 84.9 OpenAI Logo 2025-03-27 未知
DeepSeek-R1 84.6 DeepSeek-AI Logo 2025-01-20 6710.0
Claude Opus 4 83.75 Anthropic Logo 2025-05-23 未知
Claude Sonnet 4 83.05 Anthropic Logo 2025-05-23 未知
DeepSeek-V3 81.6 DeepSeek-AI Logo 2024-12-26 6810.0
Claude 3.5 Sonnet New 78.15 Anthropic Logo 2024-10-22 0.0
得分:
88.1
发布时间:
2025-07-11
参数规模(亿):
10000.0
得分:
87.65
发布时间:
2025-04-16
参数规模(亿):
未知
得分:
85.85
发布时间:
2025-06-05
参数规模(亿):
未知
得分:
84.9
发布时间:
2025-03-27
参数规模(亿):
未知
得分:
84.6
发布时间:
2025-01-20
参数规模(亿):
6710.0
得分:
83.75
发布时间:
2025-05-23
参数规模(亿):
未知
得分:
83.05
发布时间:
2025-05-23
参数规模(亿):
未知
得分:
81.6
发布时间:
2024-12-26
参数规模(亿):
6810.0
得分:
78.15
发布时间:
2024-10-22
参数规模(亿):
0.0