Kimi K2.5
Kimi K2.5 is an AI model published by Moonshot AI, released on 2026-01-27, for 多模态大模型, with 10000.0B parameters, and 256K tokens context length, requiring about 595GB storage, under the Modified MIT License license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
| Modality | Input | Output |
|---|---|---|
| Text | $0.6 | $3 |
| Image | $0.6 | -- |
| Modality | Input cache | Output cache |
|---|---|---|
| Text | $0.1 | -- |
| Image | $0.1 | -- |
Kimi K2.5 currently shows benchmark results led by HLE (17 / 149, score 50.20), LiveCodeBench (14 / 118, score 85), GPQA Diamond (31 / 175, score 87.60). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.
Kimi K2.5 是 Moonshot AI 于 2026 年 1 月推出的新一代开源多模态大语言模型。作为 Kimi K2 系列的迭代版本,K2.5 延续了前代模型的混合专家架构(Mixture-of-Experts, MoE),并在视觉理解、工具使用能力和智能体(Agentic)功能方面进行了升级。该模型基于约 15 万亿个混合视觉与文本 token 在 Kimi-K2-Base 基础上进行持续预训练,实现了原生多模态能力与高级智能体功能的整合。
Moonshot AI 采用了"静默发布"策略,用户通过网页端访问时发现原有 K2 模型已自动切换为 K2.5 版本,这种部署方式旨在收集真实用户反馈并持续优化模型表现。
Kimi K2.5 保持了与 K2 系列一致的 MoE 架构设计,具体技术规格如下:
| 技术参数 | 数值 |
|---|---|
| 总参数量 | 1 万亿(1T) |
| 激活参数量 | 320 亿(32B) |
| 架构类型 | 混合专家模型(MoE) |
| 层数(含稠密层) | 61 层 |
| 稠密层数量 | 1 层 |
| 注意力隐藏层维度 | 7168 |
| 专家隐藏层维度(每专家) | 2048 |
| 注意力头数量 | 64 |
| 专家总数 | 384 |
| 每 token 选定专家数 | 8 |
| 共享专家数量 | 1 |
| 词表大小 | 160K |
| 上下文长度 | 256K tokens |
| 注意力机制 | MLA(Multi-head Latent Attention) |
| 激活函数 | SwiGLU |
| 视觉编码器 | MoonViT(4 亿参数) |
稀疏激活机制: 通过 384 个专家中仅激活 8 个的方式,模型在保持 1 万亿参数规模的同时,推理时仅需计算 320 亿参数。
长上下文窗口: 256K tokens 的上下文长度是 K2 系列(128K)的两倍,使模型能够处理更长的文档、视频序列和多轮对话。
视觉编码器 MoonViT: 集成 4 亿参数的视觉编码器,支持对图像和视频内容的原生理解,无需依赖外部视觉模型进行模态转换。
Kimi K2.5 实现了视觉-语言联合建模:
K2.5 提供两种互补的推理模式,通过 API 参数进行切换:
思考模式(Thinking Mode):
即时模式(Instant Mode):
用户可通过在 API 请求中设置 extra_body={'thinking': {'type': 'disabled'}} 来切换到即时模式。
K2.5 引入了从单智能体向多智能体协同的范式转变:
K2.5 在 Kimi-K2-Base 基础上进行了持续预训练:
继承了 K2 系列的强化学习技术:
Kimi K2.5 提供与 OpenAI/Anthropic 兼容的 API 接口,支持以下功能:
根据官方文档建议:
模型支持主流推理引擎部署:
推荐硬件配置包括 NVIDIA Hopper(H100、H200)和 Blackwell(B100、B200、GB200)系列 GPU。
Kimi K2.5 是 K2 系列的重要迭代,而非全新架构:
K2.5 延续了 Moonshot AI 的开放策略,模型权重托管于 Hugging Face。开源协议为修改版 MIT 许可证,对月活跃用户超过 1 亿或月收入超过 2000 万美元的企业要求标注"Kimi K2"品牌标识。
根据官方文档披露,当前版本存在以下限制:
Kimi K2.5 是 Moonshot AI 在开源多模态大模型领域的最新发布。通过保持 1 万亿参数规模的 MoE 架构,同时增加原生视觉理解能力和智能体集群功能,K2.5 在效率与能力之间取得了平衡。其 256K 上下文窗口、双模式推理系统和工具使用能力,使其成为当前开源生态中具备竞争力的通用人工智能基础模型。
该模型的发布体现了 Moonshot AI 在"智能体智能"(Agentic Intelligence)领域的技术路线,展示了中国 AI 公司在模型架构创新、训练效率优化和开源生态建设方面的投入。随着多模态能力和智能体功能的完善,K2.5 为研究人员和开发者提供了一个可扩展、可部署的高性能基础模型选择。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
