Phi-4-reasoning
Phi-4-reasoning is an AI model published by Microsoft Azure, released on 2025-04-30, for 推理大模型, with 140.0B parameters, and 128K tokens context length, requiring about 128GB storage, under the MIT License license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Phi-4-Reasoning是微软最新开源的推理大模型,参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数模型)和Phi-4-Mini-Reasoning(38亿参数)。Phi-4-Reasoning是其中参数量适中的基础版本。
Phi-4-Reasoning采用开放权重的Transformer架构,专为复杂推理任务设计。该模型代表了微软在推理型语言模型领域的重大突破,能够有效利用推理时间缩放(inference-time scaling)来执行需要多步骤分解和内部反思的复杂任务。尽管参数量仅为140亿,但在性能上却能与更大规模的模型相媲美。
根据微软发布的技术资料,Phi-4-Reasoning的训练采用了精心设计的方法论:
这种训练方式证明了通过精心的数据策划和高质量合成数据集,较小的模型也能与更大的模型竞争。
在各项基准测试中,Phi-4-Reasoning展现出卓越性能:
特别值得注意的是,Phi-4-Reasoning不仅在专业推理任务上表现出色,在长输入上下文问答(FlenQA)、指令遵循(IFEval)、编程(HumanEvalPlus)、知识与语言理解(MMLUPro)、安全检测(ToxiGen)等通用能力测试中也取得了优异成绩。
Phi-4-Reasoning的主要技术优势包括:
Phi-4-Reasoning适用于多种高价值应用场景:
Phi-4-Reasoning的成功开发表明,通过精心设计的训练策略,中等规模的语言模型可以在复杂推理任务上实现突破性进展。这一发展对于推动AI民主化具有重要意义,使更多组织能够在资源限制条件下部署高性能推理系统。
该模型开创了小型语言模型的新类别,通过平衡规模和性能,足够小以适应低延迟环境,同时保持与大型模型相媲美的推理能力。Phi-4-Reasoning现已在Azure AI Foundry和HuggingFace平台上提供,为开发者提供了强大的推理工具。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
