Phi-4-reasoning
发布时间: 2025-04-30
支持
128K tokens
32768 tokens
推理大模型
2025-04-30
128GB
输入支持
输入不支持
输入不支持
输入不支持
输入不支持
输出支持
输出不支持
输出不支持
输出不支持
输出不支持
Phi-4-Reasoning是微软最新开源的推理大模型,参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数模型)和Phi-4-Mini-Reasoning(38亿参数)。Phi-4-Reasoning是其中参数量适中的基础版本。
Phi-4-Reasoning采用开放权重的Transformer架构,专为复杂推理任务设计。该模型代表了微软在推理型语言模型领域的重大突破,能够有效利用推理时间缩放(inference-time scaling)来执行需要多步骤分解和内部反思的复杂任务。尽管参数量仅为140亿,但在性能上却能与更大规模的模型相媲美。
根据微软发布的技术资料,Phi-4-Reasoning的训练采用了精心设计的方法论:
这种训练方式证明了通过精心的数据策划和高质量合成数据集,较小的模型也能与更大的模型竞争。
在各项基准测试中,Phi-4-Reasoning展现出卓越性能:
特别值得注意的是,Phi-4-Reasoning不仅在专业推理任务上表现出色,在长输入上下文问答(FlenQA)、指令遵循(IFEval)、编程(HumanEvalPlus)、知识与语言理解(MMLUPro)、安全检测(ToxiGen)等通用能力测试中也取得了优异成绩。
Phi-4-Reasoning的主要技术优势包括:
Phi-4-Reasoning适用于多种高价值应用场景:
Phi-4-Reasoning的成功开发表明,通过精心设计的训练策略,中等规模的语言模型可以在复杂推理任务上实现突破性进展。这一发展对于推动AI民主化具有重要意义,使更多组织能够在资源限制条件下部署高性能推理系统。
该模型开创了小型语言模型的新类别,通过平衡规模和性能,足够小以适应低延迟环境,同时保持与大型模型相媲美的推理能力。Phi-4-Reasoning现已在Azure AI Foundry和HuggingFace平台上提供,为开发者提供了强大的推理工具。
关注DataLearnerAI微信公众号,接受最新大模型资讯