Kimi K2 Thinking

Kimi K2 Thinking

模型解读

Moonshot AI 于 2025 年 11 月 6 日发布了 Kimi K2 Thinking 模型。这是 Kimi K2 系列的第一个推理变体。该公司位于北京，由阿里巴巴支持。Kimi K2 系列此前在 2025 年 7 月和 9 月发布了非推理版本的 Kimi K2 Instruct 模型。

模型规格

Kimi K2 Thinking 采用混合专家（MoE）架构，总参数量为 1 万亿，活跃参数为 320 亿。它使用 INT4 精度，这比先前版本的 FP8 精度更节省空间，模型文件大小约为 594 GB。上下文窗口支持 256K 令牌。输入和输出仅限于文本模态。

Moonshot AI 在后训练阶段使用了量化感知训练，以实现 INT4 精度。这使得模型在较旧的 NVIDIA GPU 上运行时更高效，因为这些 GPU 不支持 FP4。

功能和能力

该模型设计为思考代理，支持多步推理和工具使用。它可以执行 200 到 300 个连续工具调用，而无需人类干预。主要应用包括推理、代理搜索和编码任务。在测试时，它通过扩展思考令牌和工具调用轮次来处理复杂任务。

在代理任务基准中，Kimi K2 Thinking 在 Tau2 Bench Telecom 上得分 93%，模拟客户服务代理场景。在 HLE 上得分 44.9%，在 BrowseComp 上得分 60.2%。这些分数使其在开源模型中位居前列。