Llama3.1-8B-Instruct 评测详情
Llama3.1-8B-Instruct 当前已收录的代表性评测结果包括 GSM8K(16 / 26,得分 82.40)、MBPP(18 / 28,得分 69.40)、HumanEval(28 / 39,得分 66.50)。
Llama3.1-8B-Instruct 当前已收录的代表性评测结果包括 GSM8K(16 / 26,得分 82.40)、MBPP(18 / 28,得分 69.40)、HumanEval(28 / 39,得分 66.50)。