DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
页面导航
大模型列表MiniCPM5-1B
MI

MiniCPM5-1B

推理大模型

MiniCPM5-1B

发布时间: 2026-05-010
在线体验GitHubHugging FaceCompare
模型参数
10.8亿
上下文长度
128K (131072)
中文支持
支持
推理能力

MiniCPM5-1B 是由 OpenBMB 发布的 AI 模型,发布时间为 2026-05-01,定位为 推理大模型,参数规模约为 10.8B,上下文长度为 128K,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniCPM5-1B

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K (131072) tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2026-05-01
模型文件大小
暂无数据
MoE架构
是
总参数 / 激活参数
10.8 亿 / 暂无数据
知识截止
暂无数据
MiniCPM5-1B

开源和体验地址

代码开源状态
Apache 2.0
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
https://github.com/OpenBMB/MiniCPM
Hugging Face
https://huggingface.co/openbmb/MiniCPM5-1B
在线体验
暂无在线体验地址
MiniCPM5-1B

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
MiniCPM5-1B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
MiniCPM5-1B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

MiniCPM5-1B

发布机构

OpenBMB
OpenBMB
查看发布机构详情
MiniCPM5-1B

模型解读

模型简介与核心特点

基本信息: MiniCPM5-1B 是面壁智能(ModelBest Inc.)与 OpenBMB 社区于 2026 年 5 月联合发布的端侧语言模型。作为 MiniCPM5 系列的首个里程碑版本,该模型旨在为端侧设备、本地助手和资源受限环境提供高性能的语言 AI 能力。
核心目标: MiniCPM5-1B 专为本地助手、编程智能体、工具调用工作流及需要复杂推理的场景而设计,力求在紧凑的模型体积下,提供业界领先的 1B 级开源性能。

架构与技术规格

模型参数: 模型总参数量为 1,080,632,832(约 10.8 亿),非嵌入参数为 679,552,512。 架构: 采用标准 Llama 因果语言模型架构(StandardLlamaForCausalLM),包含 24 层 Transformer,使用分组查询注意力(GQA),其中查询头(Q)为 16 个,键值头(KV)为 2 个。 上下文窗口: 原生支持 131,072(128K)Tokens 的上下文长度,适用于长文档理解与长程对话等场景。 训练数据与策略: 训练过程采用全栈式超数据分层管理方案,涵盖基础训练、中期训练和后训练三个阶段。训练语料已开源,包括 Ultra-FineWeb、UltraData-Math 等数据集。后训练阶段采用了强化学习与在线策略蒸馏技术,显著提升了数学、编程和指令遵循能力。

核心能力与推理模式

MiniCPM5-1B 是一个纯文本模型。其标志性特性是原生支持混合推理:通过同一个模型检查点和内置的聊天模板,用户可以在常规模式(No Think)与思考模式(Think)间一键切换,使该模型既是一个快速响应的日常助手,也是一个深思熟虑的推理者。在工具使用、代码生成和高难度推理任务上,该模型展现出同尺寸最前沿的性能。

性能与基准评测

在与同尺寸顶尖开源模型的对比评测中,MiniCPM5-1B 取得了该级别的领先成绩,尤其在工具使用、代码和推理方面优势明显。在 Artificial Analysis 的智能指数中,该模型获得了 18 分,远超同类模型的平均水平(8 分),展现了卓越的综合智能水平。

应用场景与限制

推荐用例: 官方推荐的应用场景包括本地编程助手、工具调用代理、个人日常助理以及需要逻辑推理的复杂任务。得益于其小巧的体积,它非常适合在手机、PC 等端侧设备上运行。 已知局限: 作为一个小型纯文本模型,它不具备图像、视频或音频等多模态理解与生成能力。在处理需要庞杂世界知识的任务时,可能会受到模型参数规模的制约。

访问方式与许可

模型权重与代码: 模型在 Hugging Face 和 ModelScope 上开源,提供 BF16、GGUF、MLX 等多种格式,方便在不同框架和硬件上部署。官方 GitHub 仓库提供详尽的部署、微调手册和智能体技能包。 许可证: 模型遵循 Apache 2.0 许可证。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码