长时运行智能体是指:基于大语言模型(LLM)的 Agent 系统在较长时间跨度内(从数十分钟到数小时、甚至跨天)持续执行一个或多个目标任务,并在此过程中能够自主规划、分解、调用工具、处理反馈、恢复中断并持续推进进度。
在业界语境中,Long-Running Agent 有时也被称为:Long-Horizon Agent(长时程智能体)、Persistent Agent(持久化智能体)、Background Agent(后台智能体)、或强调“无人值守”的 Autonomous Agent(自治智能体)。这些叫法侧重点不同,但通常都在描述“任务不在一次对话内完成,而是持续推进”的 Agent 能力。
核心特征
- 长时间任务推进:任务目标需要多轮迭代与外部交互(例如爬取资料、跑批处理、写代码、反复试错),无法在一次短对话内完成。
- 自治执行与调度:具备计划(Plan)与执行(Act)的循环能力,能根据中间结果动态调整步骤。
- 工具与环境交互:持续调用外部工具/系统(如搜索、数据库、代码执行、工单系统、CRM、CI/CD 等),并能处理工具返回的成功/失败。
- 状态与进度管理:显式维护任务状态(进度、待办、已完成、失败原因、重试策略等),必要时可跨会话继续。
- 鲁棒性与可恢复性:支持中断恢复、重试、幂等、检查点(checkpoint)、回滚与人工介入(human-in-the-loop)。
与“多轮对话式 LLM 自动化”的区别
长时运行智能体不仅是“对话轮数变多”,而是把 LLM 放进一个可持续运行的执行框架中:
- 从“聊天”到“运行”:LLM 生成步骤只是其中一环,系统还要负责调度、执行、监控与恢复。
- 从“上下文堆叠”到“状态工程”:重点不再是把所有历史对话塞进 prompt,而是用结构化状态(任务树、记忆、日志、检查点)来支撑长周期执行。
- 从“脚本化流程”到“动态策略”:不是固定脚本,而是能根据实时反馈改变计划、选择工具与策略。
典型场景
- 复杂项目交付:自动生成需求拆解、代码实现、测试、修复、提交 PR,并跟进 CI 结果。
- 企业流程自动化:跨系统收集信息、生成报告、创建工单、等待审批、补充材料、持续跟进。
- 数据与研究任务:长时间检索、清洗、分析、反复验证结论,并输出可追溯的产物。
相关术语
- Agent / AI Agent:智能体
- Planning:规划
- Tool Calling / Function Calling:工具调用
- Memory / State Management:记忆与状态管理
- Checkpointing:检查点
- Human-in-the-Loop:人在回路
- Long-Horizon Reasoning:长时程推理