基础概念
长时运行 AgentLong-running Agent
从“一问一答”的助手,到能持续工作数小时甚至跨天的协作者
收录于 2026-05-01·最近更新 2026-05-26·热门词条
过去两年里,"AI Agent"这个词的含义发生了关键变化。早期 Agent 更像是一个会调用工具的聊天助手——你给它一个问题,它在几轮对话内给出答案。但从 2025 年开始,业界逐渐把注意力转向 长时运行 Agent (Long-running Agent):能跨小时、跨天、跨多个会话持续推进复杂任务的系统。
让 Agent 真正能"跑很久",需要在工程上解决三件事:
- 完成条件—怎么判断"任务真的做完了"?不能仅凭模型说"我做完了",必须有客观可评估的标准。
- 上下文管理—长时间运行意味着对话历史和工具输出会持续膨胀,超出模型上下文窗口。需要压缩、归档、按需检索机制。
- 失败恢复—单步失败不能让整个任务崩盘。需要重试、回滚、状态持久化、必要时人工介入。
这一方向催生了一系列具体能力的成形,包括 Goal 模式(让 Agent 按完成条件自主推进)、Automations / Routines(按计划或事件唤醒 Agent)、跨会话 Memory 等。可以认为:当下主流 AI Agent 产品的演进,几乎都围绕"如何让 Agent 跑得更久、更可靠"这一个核心问题展开。
相关产品
- Claude Code — Anthropic 的代码 Agent,是目前长时运行能力最完整的产品之一(Goal、Routines、Stop Hook)。
- OpenAI Codex — 从 ChatGPT 代码助手演进而来,主推 Automations 和云端长期任务。
- Cursor Background Agents — 从 IDE 委派任务到云端后台执行,结果以 diff 形式回到本地。
- Devin — Cognition 推出的端到端软件 Agent,强调跨小时的工程任务交付。