Phi-4-reasoning-plus

Name: Phi-4-reasoning-plus
Author: Microsoft Azure

推理大模型Phi-4

发布时间: 2025-04-30更新于: 2025-05-01 22:04:33725

在线体验GitHubHugging Face Compare

模型参数

140亿

上下文长度

128K

中文支持

不支持

推理能力

Phi-4-reasoning-plus 是由 Microsoft Azure 发布的 AI 模型，发布时间为 2025-04-30，定位为推理大模型，参数规模约为 140亿，上下文长度为 128K，模型文件大小约 128GB，采用 MIT License 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Phi-4-reasoning-plus

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

32K tokens

模型类型

推理大模型

输入/输出模态

文本 → 文本

发布时间

2025-04-30

模型文件大小

128GB

MoE架构

否

总参数 / 激活参数

140亿 / 不涉及

知识截止

暂无数据

Phi-4-reasoning-plus

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

暂无GitHub开源地址

Hugging Face

https://huggingface.co/microsoft/Phi-4-reasoning-plus

在线体验

https://ai.azure.com/explore/models/Phi-4-mini-reasoning/version/1/registry/azureml?tid=6f714156-4693-43a7-9608-20e08d45a02f

Phi-4-reasoning-plus

官方介绍与博客

官方论文

One year of Phi: Small language models making big leaps in AI

DataLearnerAI博客

微软开源140亿参数规模的Phi-4推理版本大模型：多项评测结果超过OpenAI o1-mini，单张4090可运行，完全免费开源

Phi-4-reasoning-plus

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

Phi-4-reasoning-plus

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Phi-4-reasoning-plus

发布机构

Microsoft Azure

查看发布机构详情

Phi-4-reasoning-plus

模型解读

Phi-4-Reasoning-Plus是微软最新开源的推理大模型，参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本，分别是Phi-4-reasoning（140亿参数）、Phi-4-reasoning-plus（增强版140亿参数模型）和Phi-4-Mini-Reasoning（38亿参数）。Phi-4-Reasoning-Plus是其中性能最强的增强版本。

技术架构与设计理念

Phi-4-Reasoning-Plus在Phi-4-Reasoning的基础上进行了进一步强化，保持相同的140亿参数量，但通过额外的训练技术显著提升了推理性能。该模型延续了微软在小型高效推理模型领域的创新，代表了当前小型语言模型推理能力的顶峰水平。

训练方法创新

Phi-4-Reasoning-Plus的训练过程建立在Phi-4-Reasoning的基础上，增加了强化学习阶段：

继承基础版训练：继承Phi-4-Reasoning的高质量监督微调训练基础
强化学习优化：通过强化学习技术进一步提升模型能力，专注于优化推理时计算资源的利用效率
推理时间扩展：训练模型使用比Phi-4-Reasoning多1.5倍的tokens，以提供更高准确性

这种渐进式的训练方法使模型能够更有效地利用推理时间计算资源，在不增加参数量的情况下显著提升性能。

性能特点

Phi-4-Reasoning-Plus的最显著特征是其推理深度和准确性：

使用比Phi-4-Reasoning多1.5倍的tokens进行推理
在各项基准测试中提供更高的准确性
在大多数基准测试中超越OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B
性能接近甚至超过拥有6710亿参数的DeepSeek-R1模型

特别值得注意的是，在2025年美国数学奥林匹克预选赛AIME 2025测试上，Phi-4-Reasoning-Plus展现出超越大型模型的能力，证明了强化学习在提升推理性能方面的有效性。

技术优势与应用场景

Phi-4-Reasoning-Plus相比基础版本提供了多项优势：

更深入的推理链：生成更长、更详细的推理过程
更高的准确率：通过更充分的思考过程提高最终答案的准确性
优化的推理时间-准确性平衡：在推理深度和计算效率之间找到最佳平衡点
强化学习增益：展示了强化学习技术在推理模型训练中的价值

这些特性使Phi-4-Reasoning-Plus特别适合：

需要高准确性的关键业务决策支持系统
复杂科学和数学问题的求解
高层次的策略规划和多步骤推理任务
对推理过程透明度有高要求的应用场景

在微软生态中的定位

作为微软推理模型家族中的高端产品，Phi-4-Reasoning-Plus被设计为：

Windows生态系统中的高性能推理引擎
适用于Copilot+ PC平台，通过低位优化适配NPU运行
开发者APIs的高性能后端，支持各类应用程序中的复杂推理任务
微软责任AI策略的实践范例，结合了性能与安全考量

技术意义

Phi-4-Reasoning-Plus的成功开发代表了小型语言模型向高性能推理能力迈进的重要里程碑。其140亿参数的规模，配合精心设计的强化学习训练方案，证明了通过科学的方法论可以在不增加模型大小的情况下显著提升性能。

这一模型打破了"更大即更好"的传统观念，为资源高效AI的发展提供了新方向。通过在Azure AI Foundry和HuggingFace平台上的公开发布，Phi-4-Reasoning-Plus将为更广泛的AI社区提供高性能推理技术，推动推理型AI应用的民主化进程。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送