Ph

Phi-4-reasoning

推理大模型

Phi-4-reasoning

发布时间: 2025-04-30

模型参数(Parameters)
140.0
最高上下文长度(Context Length)
128K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

32768 tokens

模型类型

推理大模型

发布时间

2025-04-30

模型预文件大小

128GB

开源和体验地址

API接口信息

接口速度(满分5分)
接口价格
输入价格:
  • 文本:
  • 图片:
  • 音频:
  • 视频:
  • Embedding:
输出价格:
  • 文本:
  • 图片:
  • 音频:
  • 视频:
  • Embedding:

输入支持的模态

文本

输入支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Phi-4-reasoning模型在各大评测榜单的评分

发布机构

模型介绍

Phi-4-Reasoning是微软最新开源的推理大模型,参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数模型)和Phi-4-Mini-Reasoning(38亿参数)。Phi-4-Reasoning是其中参数量适中的基础版本。

技术架构与设计理念

Phi-4-Reasoning采用开放权重的Transformer架构,专为复杂推理任务设计。该模型代表了微软在推理型语言模型领域的重大突破,能够有效利用推理时间缩放(inference-time scaling)来执行需要多步骤分解和内部反思的复杂任务。尽管参数量仅为140亿,但在性能上却能与更大规模的模型相媲美。

训练方法创新

根据微软发布的技术资料,Phi-4-Reasoning的训练采用了精心设计的方法论:

  1. 监督微调:基于Phi-4基础模型,使用从OpenAI o3-mini模型中精心策划的推理演示数据进行监督微调
  2. 数据质量优先:注重高质量合成数据集的构建,而非简单地增加训练数据量
  3. 推理链生成:训练模型生成详细的推理链,有效利用额外的推理时间计算资源

这种训练方式证明了通过精心的数据策划和高质量合成数据集,较小的模型也能与更大的模型竞争。

性能表现

在各项基准测试中,Phi-4-Reasoning展现出卓越性能:

  • 在大多数基准测试中,包括数学推理和博士级科学问题上,性能超过OpenAI的o1-mini和DeepSeek-R1-Distill-Llama-70B
  • 在AIME 2025测试(2025年美国数学奥林匹克预选赛)上,表现优于拥有6710亿参数的完整DeepSeek-R1模型
  • 在涵盖数学和科学推理的代表性基准测试中,显著超越基础Phi-4模型

特别值得注意的是,Phi-4-Reasoning不仅在专业推理任务上表现出色,在长输入上下文问答(FlenQA)、指令遵循(IFEval)、编程(HumanEvalPlus)、知识与语言理解(MMLUPro)、安全检测(ToxiGen)等通用能力测试中也取得了优异成绩。

技术优势与部署特点

Phi-4-Reasoning的主要技术优势包括:

  • 推理时间缩放:能够有效利用额外的推理时间计算资源,生成更准确的结果
  • 规模效率比:以显著更小的参数量实现与大型模型相当的性能
  • 多领域适应性:在数学、编程、算法问题解决和规划等多个领域表现优异
  • Windows 11生态系统集成:经过优化可在Copilot+ PC的NPU上运行

应用场景

Phi-4-Reasoning适用于多种高价值应用场景:

  • 需要复杂多步骤推理的业务应用
  • 教育和研究环境中的数学和科学问题解决
  • 作为代理型应用(agentic applications)的核心引擎,处理复杂的多方面任务
  • 在计算资源有限但需要高质量推理的环境中部署

技术意义

Phi-4-Reasoning的成功开发表明,通过精心设计的训练策略,中等规模的语言模型可以在复杂推理任务上实现突破性进展。这一发展对于推动AI民主化具有重要意义,使更多组织能够在资源限制条件下部署高性能推理系统。

该模型开创了小型语言模型的新类别,通过平衡规模和性能,足够小以适应低延迟环境,同时保持与大型模型相媲美的推理能力。Phi-4-Reasoning现已在Azure AI Foundry和HuggingFace平台上提供,为开发者提供了强大的推理工具。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat