Phi-4-reasoning-plus
发布时间: 2025-04-30
支持
128K tokens
32768 tokens
推理大模型
2025-04-30
128GB
输入支持
输入不支持
输入不支持
输入不支持
输入不支持
输出支持
输出不支持
输出不支持
输出不支持
输出不支持
Phi-4-Reasoning-Plus是微软最新开源的推理大模型,参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数模型)和Phi-4-Mini-Reasoning(38亿参数)。Phi-4-Reasoning-Plus是其中性能最强的增强版本。
Phi-4-Reasoning-Plus在Phi-4-Reasoning的基础上进行了进一步强化,保持相同的140亿参数量,但通过额外的训练技术显著提升了推理性能。该模型延续了微软在小型高效推理模型领域的创新,代表了当前小型语言模型推理能力的顶峰水平。
Phi-4-Reasoning-Plus的训练过程建立在Phi-4-Reasoning的基础上,增加了强化学习阶段:
这种渐进式的训练方法使模型能够更有效地利用推理时间计算资源,在不增加参数量的情况下显著提升性能。
Phi-4-Reasoning-Plus的最显著特征是其推理深度和准确性:
特别值得注意的是,在2025年美国数学奥林匹克预选赛AIME 2025测试上,Phi-4-Reasoning-Plus展现出超越大型模型的能力,证明了强化学习在提升推理性能方面的有效性。
Phi-4-Reasoning-Plus相比基础版本提供了多项优势:
这些特性使Phi-4-Reasoning-Plus特别适合:
作为微软推理模型家族中的高端产品,Phi-4-Reasoning-Plus被设计为:
Phi-4-Reasoning-Plus的成功开发代表了小型语言模型向高性能推理能力迈进的重要里程碑。其140亿参数的规模,配合精心设计的强化学习训练方案,证明了通过科学的方法论可以在不增加模型大小的情况下显著提升性能。
这一模型打破了"更大即更好"的传统观念,为资源高效AI的发展提供了新方向。通过在Azure AI Foundry和HuggingFace平台上的公开发布,Phi-4-Reasoning-Plus将为更广泛的AI社区提供高性能推理技术,推动推理型AI应用的民主化进程。
关注DataLearnerAI微信公众号,接受最新大模型资讯