Open LLM Leaderboard (China Mirror)

Name: Open LLM Leaderboard (China Mirror)
Creator: DataLearner
License: https://creativecommons.org/licenses/by/4.0/

Open LLM Leaderboard tracks model performance on ARC, HellaSwag, MMLU, TruthfulQA, Winogrande, and GSM8K benchmarks.

Top Model

openchat_v3.2_super

Top Score

Model Count

100

Data version

Data source: HuggingFace

Leaderboard snapshot month:

Ranking Table

Model	Type	Parameters (B)	Average	ARC	HellaSwag	MMLU	TruthfulQA	Winogrande	GSM8K	Architecture
openchat_v3.2_super	Fine Tuned Models	0	54.99	59.81	82.50	55.90	42.30	75.93	13.50

Data is for reference only. Official sources are authoritative. Click model names to view DataLearner model profiles.