← 返回总榜单

Open LLM Leaderboard 中国站

Open LLM Leaderboard是追踪大模型评测结果的排行榜，通过追踪大语言模型和ChatBot在不同评测任务上的表现来对模型进行排名和评估。

数据来源: HuggingFace

筛选条件

模型类型:全部模型 Pretrained Models Fine Tuned Models Chat Models Merged or MoE Models

模型名称	模型类型	参数大小(亿)	平均分	ARC分数	HellaSwag分数	MMLU分数	TruthfulQA分数	Winogrande分数	GSM8K分数	模型架构
test_mistral2	Fine Tuned Models	71.1	29.27	27.9	25.32	24.74	49.1	48.54	0.0	MistralModel
gpt2-dolly	Chat Models	1.2	29.21	22.7	30.15

数据仅供参考，以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。