加载中...
Phi-4-mini-instruct (3.8B) 当前已收录的代表性评测结果包括 GSM8K(14 / 26,得分 88.60)、HumanEval(24 / 39,得分 74.40)、MATH(27 / 42,得分 64)。