Ph

Phi-4-reasoning-plus

推理大模型

Phi-4-reasoning-plus

发布时间: 2025-04-30

模型参数(Parameters)
140.0
最高上下文长度(Context Length)
128K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

32768 tokens

模型类型

推理大模型

发布时间

2025-04-30

模型预文件大小

128GB

开源和体验地址

API接口信息

接口速度(满分5分)
接口价格
输入价格:
  • 文本:
  • 图片:
  • 音频:
  • 视频:
  • Embedding:
输出价格:
  • 文本:
  • 图片:
  • 音频:
  • 视频:
  • Embedding:

输入支持的模态

文本

输入支持

图片

输入不支持

视频

输入不支持

音频

输入不支持

Embedding(向量)

输入不支持

输出支持的模态

文本

输出支持

图片

输出不支持

视频

输出不支持

音频

输出不支持

Embedding(向量)

输出不支持

Phi-4-reasoning-plus模型在各大评测榜单的评分

发布机构

模型介绍

Phi-4-Reasoning-Plus是微软最新开源的推理大模型,参数140亿。本次微软开源的Phi-4推理版包含3个不同的版本,分别是Phi-4-reasoning(140亿参数)、Phi-4-reasoning-plus(增强版140亿参数模型)和Phi-4-Mini-Reasoning(38亿参数)。Phi-4-Reasoning-Plus是其中性能最强的增强版本。

技术架构与设计理念

Phi-4-Reasoning-Plus在Phi-4-Reasoning的基础上进行了进一步强化,保持相同的140亿参数量,但通过额外的训练技术显著提升了推理性能。该模型延续了微软在小型高效推理模型领域的创新,代表了当前小型语言模型推理能力的顶峰水平。

训练方法创新

Phi-4-Reasoning-Plus的训练过程建立在Phi-4-Reasoning的基础上,增加了强化学习阶段:

  1. 继承基础版训练:继承Phi-4-Reasoning的高质量监督微调训练基础
  2. 强化学习优化:通过强化学习技术进一步提升模型能力,专注于优化推理时计算资源的利用效率
  3. 推理时间扩展:训练模型使用比Phi-4-Reasoning多1.5倍的tokens,以提供更高准确性

这种渐进式的训练方法使模型能够更有效地利用推理时间计算资源,在不增加参数量的情况下显著提升性能。

性能特点

Phi-4-Reasoning-Plus的最显著特征是其推理深度和准确性:

  • 使用比Phi-4-Reasoning多1.5倍的tokens进行推理
  • 在各项基准测试中提供更高的准确性
  • 在大多数基准测试中超越OpenAI o1-mini和DeepSeek-R1-Distill-Llama-70B
  • 性能接近甚至超过拥有6710亿参数的DeepSeek-R1模型

特别值得注意的是,在2025年美国数学奥林匹克预选赛AIME 2025测试上,Phi-4-Reasoning-Plus展现出超越大型模型的能力,证明了强化学习在提升推理性能方面的有效性。

技术优势与应用场景

Phi-4-Reasoning-Plus相比基础版本提供了多项优势:

  • 更深入的推理链:生成更长、更详细的推理过程
  • 更高的准确率:通过更充分的思考过程提高最终答案的准确性
  • 优化的推理时间-准确性平衡:在推理深度和计算效率之间找到最佳平衡点
  • 强化学习增益:展示了强化学习技术在推理模型训练中的价值

这些特性使Phi-4-Reasoning-Plus特别适合:

  • 需要高准确性的关键业务决策支持系统
  • 复杂科学和数学问题的求解
  • 高层次的策略规划和多步骤推理任务
  • 对推理过程透明度有高要求的应用场景

在微软生态中的定位

作为微软推理模型家族中的高端产品,Phi-4-Reasoning-Plus被设计为:

  • Windows生态系统中的高性能推理引擎
  • 适用于Copilot+ PC平台,通过低位优化适配NPU运行
  • 开发者APIs的高性能后端,支持各类应用程序中的复杂推理任务
  • 微软责任AI策略的实践范例,结合了性能与安全考量

技术意义

Phi-4-Reasoning-Plus的成功开发代表了小型语言模型向高性能推理能力迈进的重要里程碑。其140亿参数的规模,配合精心设计的强化学习训练方案,证明了通过科学的方法论可以在不增加模型大小的情况下显著提升性能。

这一模型打破了"更大即更好"的传统观念,为资源高效AI的发展提供了新方向。通过在Azure AI Foundry和HuggingFace平台上的公开发布,Phi-4-Reasoning-Plus将为更广泛的AI社区提供高性能推理技术,推动推理型AI应用的民主化进程。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat