DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
AI Agent 雷达/基础概念/长时运行 Agent
基础概念

长时运行 AgentLong-running Agent

从“一问一答”的助手,到能持续工作数小时甚至跨天的协作者

收录于 2026-05-01·最近更新 2026-05-26·热门词条

过去两年里,"AI Agent"这个词的含义发生了关键变化。早期 Agent 更像是一个会调用工具的聊天助手——你给它一个问题,它在几轮对话内给出答案。但从 2025 年开始,业界逐渐把注意力转向 长时运行 Agent (Long-running Agent):能跨小时、跨天、跨多个会话持续推进复杂任务的系统。

让 Agent 真正能"跑很久",需要在工程上解决三件事:

  • 完成条件—怎么判断"任务真的做完了"?不能仅凭模型说"我做完了",必须有客观可评估的标准。
  • 上下文管理—长时间运行意味着对话历史和工具输出会持续膨胀,超出模型上下文窗口。需要压缩、归档、按需检索机制。
  • 失败恢复—单步失败不能让整个任务崩盘。需要重试、回滚、状态持久化、必要时人工介入。

这一方向催生了一系列具体能力的成形,包括 Goal 模式(让 Agent 按完成条件自主推进)、Automations / Routines(按计划或事件唤醒 Agent)、跨会话 Memory 等。可以认为:当下主流 AI Agent 产品的演进,几乎都围绕"如何让 Agent 跑得更久、更可靠"这一个核心问题展开。

相关产品

  • Claude Code — Anthropic 的代码 Agent,是目前长时运行能力最完整的产品之一(Goal、Routines、Stop Hook)。
  • OpenAI Codex — 从 ChatGPT 代码助手演进而来,主推 Automations 和云端长期任务。
  • Cursor Background Agents — 从 IDE 委派任务到云端后台执行,结果以 diff 形式回到本地。
  • Devin — Cognition 推出的端到端软件 Agent,强调跨小时的工程任务交付。

参考资料

  • OpenAI:Codex for Almost Everything(长期自动化方向)
  • AI Harness Engineering(arXiv 2605.13357)

同类词条 · 基础概念

  • Goal 模式

    Goal Mode

    描述"什么样算完成",剩下的反复尝试与验证交给 Agent

  • Agent Harness

    Agent 能力强不强,模型只是一部分原因