AI 的下一阶段，不是更长的推理链，而是真正的行动力，大模型训练将从“推理式思考”走向“智能体式思考”——前 Qwen 负责人林俊旸（Junyang Lin）最新判断

Junyang 是前 Qwen（通义千问）负责人，前段时间他的离职造成了许多人的关注。不过他并未沉寂，就在刚才，Junyang 发表了一篇关于如何训练大模型推理能力、以及未来大模型推理能力训练应该走向何方的深度讨论。文章里透露了一些关于 Qwen 训练过程中的思考和踩坑经历。原文稍有深度，在这里我们尽量用通俗易懂的语言和大家介绍一下其中的情况。

AI 的下一阶段，不是更长的推理链，而是真正的行动力，大模型训练将从“推理式思考”走向“智能体式思考”——前 Qwen 负责人林俊旸（Junyang Lin）最新判断

DataLearner WeChat

先说说现在大模型发展到哪了

一、"让模型学会思考"，背后有多难？

二、Qwen 团队曾经想做一件很难的事

三、Anthropic 的克制，提供了一个有用的参照

四、真正的下一步：从"会思考"到"会行动"

五、训练"会行动的 AI"，难在哪？

六、未来不只是单个智能体，而是智能体组成的系统

结语：竞争的战场正在转移