加载中...
加载中...
Kimi K2.5
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.6 | $3 |
| 图片 | $0.6 | -- |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | $0.1 | -- |
| 图片 | $0.1 | -- |
Kimi K2.5 是 Moonshot AI 于 2026 年 1 月推出的新一代开源多模态大语言模型。作为 Kimi K2 系列的迭代版本,K2.5 延续了前代模型的混合专家架构(Mixture-of-Experts, MoE),并在视觉理解、工具使用能力和智能体(Agentic)功能方面进行了升级。该模型基于约 15 万亿个混合视觉与文本 token 在 Kimi-K2-Base 基础上进行持续预训练,实现了原生多模态能力与高级智能体功能的整合。
Moonshot AI 采用了"静默发布"策略,用户通过网页端访问时发现原有 K2 模型已自动切换为 K2.5 版本,这种部署方式旨在收集真实用户反馈并持续优化模型表现。
Kimi K2.5 保持了与 K2 系列一致的 MoE 架构设计,具体技术规格如下:
| 技术参数 | 数值 |
|---|---|
| 总参数量 | 1 万亿(1T) |
| 激活参数量 | 320 亿(32B) |
| 架构类型 | 混合专家模型(MoE) |
| 层数(含稠密层) | 61 层 |
| 稠密层数量 | 1 层 |
| 注意力隐藏层维度 | 7168 |
| 专家隐藏层维度(每专家) | 2048 |
| 注意力头数量 | 64 |
| 专家总数 | 384 |
| 每 token 选定专家数 | 8 |
| 共享专家数量 | 1 |
| 词表大小 | 160K |
| 上下文长度 | 256K tokens |
| 注意力机制 | MLA(Multi-head Latent Attention) |
| 激活函数 | SwiGLU |
| 视觉编码器 | MoonViT(4 亿参数) |
稀疏激活机制: 通过 384 个专家中仅激活 8 个的方式,模型在保持 1 万亿参数规模的同时,推理时仅需计算 320 亿参数。
长上下文窗口: 256K tokens 的上下文长度是 K2 系列(128K)的两倍,使模型能够处理更长的文档、视频序列和多轮对话。
视觉编码器 MoonViT: 集成 4 亿参数的视觉编码器,支持对图像和视频内容的原生理解,无需依赖外部视觉模型进行模态转换。
Kimi K2.5 实现了视觉-语言联合建模:
K2.5 提供两种互补的推理模式,通过 API 参数进行切换:
思考模式(Thinking Mode):
即时模式(Instant Mode):
用户可通过在 API 请求中设置 extra_body={'thinking': {'type': 'disabled'}} 来切换到即时模式。
K2.5 引入了从单智能体向多智能体协同的范式转变:
K2.5 在 Kimi-K2-Base 基础上进行了持续预训练:
继承了 K2 系列的强化学习技术:
Kimi K2.5 提供与 OpenAI/Anthropic 兼容的 API 接口,支持以下功能:
根据官方文档建议:
模型支持主流推理引擎部署:
推荐硬件配置包括 NVIDIA Hopper(H100、H200)和 Blackwell(B100、B200、GB200)系列 GPU。
Kimi K2.5 是 K2 系列的重要迭代,而非全新架构:
K2.5 延续了 Moonshot AI 的开放策略,模型权重托管于 Hugging Face。开源协议为修改版 MIT 许可证,对月活跃用户超过 1 亿或月收入超过 2000 万美元的企业要求标注"Kimi K2"品牌标识。
根据官方文档披露,当前版本存在以下限制:
Kimi K2.5 是 Moonshot AI 在开源多模态大模型领域的最新发布。通过保持 1 万亿参数规模的 MoE 架构,同时增加原生视觉理解能力和智能体集群功能,K2.5 在效率与能力之间取得了平衡。其 256K 上下文窗口、双模式推理系统和工具使用能力,使其成为当前开源生态中具备竞争力的通用人工智能基础模型。
该模型的发布体现了 Moonshot AI 在"智能体智能"(Agentic Intelligence)领域的技术路线,展示了中国 AI 公司在模型架构创新、训练效率优化和开源生态建设方面的投入。随着多模态能力和智能体功能的完善,K2.5 为研究人员和开发者提供了一个可扩展、可部署的高性能基础模型选择。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
