微软开源140亿参数规模的Phi-4推理版本大模型:多项评测结果超过OpenAI o1-mini,单张4090可运行,完全免费开源
微软发布了全新的Phi-4推理模型系列,是小型语言模型(SLM)在复杂推理能力上的一种新的尝试。本次发布包含三个不同规模和性能的推理模型,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数)和Phi-4-Mini-Reasoning(38亿参数)。这三款模型尽管参数规模远小于当前主流大型语言模型,却在多项推理基准测试中展现出与甚至超越大型模型的能力。

Phi-4 Reasoning系列模型介绍
微软Phi系列模型是由微软研究院开发的一系列“小型语言模型”(Small Language Models, SLMs)。与业界追求更大参数量的趋势不同,Phi系列模型的核心理念是通过使用精心筛选的高质量、"教科书级别"的训练数据,在相对较小的模型规模下实现卓越的性能,特别是在常识推理、语言理解和逻辑推理等方面。
在2025年2月底,微软就开源了第四代Phi-4系列,不过当时微软开源的是没有推理能力的版本,并表示他们在训练Phi-4的推理版本。而2个月后的今天,微软就发布了3个推理版Phi-4-reasoning系列。
