加载中...
加载中...
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

Andrej Karpathy 是 AI 领域极具影响力的研究者,曾任特斯拉 AI 总监,并在 OpenAI 从事核心研究工作。2025 年底,他基于近几周密集使用 Claude 等大型语言模型(尤其是偏向 Claude Code 场景)的真实编码体验,撰写了一份反思笔记,系统性讨论了软件工程正在从“人主导编码”向“AI Agent 主导执行”转变的过程,以及这一转变带来的效率跃迁、方法论变化与潜在风险。
摘要(Abstract)
本文系统梳理了 Andrej Karpathy 在 2025 年底关于 AI Agent 编程的核心观点。Karpathy 基于其近期大量使用 Claude Code 等大型语言模型的真实工程经验,指出软件工程正在从“人主导的手动编码”转向“以 AI Agent 为执行主体、人类定义目标与约束”的新范式。文章总结了 AI Agent 在编码效率、工作流、工程方法论上的实际优势,同时也客观分析了其在概念性错误、过度抽象、监督成本、工程质量与个人技能退化等方面的现实问题。Karpathy 进一步提出,2026 年将是 AI Agent 能力被行业系统性消化的一年,工程师生产力差距、通才与专才分工、以及软件内容质量结构都可能发生深刻变化。

Karpathy 在笔记中坦言,他对 LLM 编码能力在短时间内取得的跃迁感到震惊,并迅速调整了自己的工作方式:从以手动编写代码为主,转向主要通过自然语言“指挥”AI Agent 生成和迭代代码。尽管这一转变在心理上伴随着一定的不适(例如对个人编码能力的自尊冲击),但他明确认为,这是一次量级极高的生产力提升,甚至可以说重塑了其二十余年的编程习惯。
他同时指出,当前的 AI Agent 仍然存在概念性错误、过度抽象和缺乏自我反思等问题,需要工程师保持高度监督。但即便如此,AI Agent 展现出的“持续执行、反复尝试直至成功”的特性,已经带来了强烈的“AGI 体验”。他也因此提出了一系列更宏观的问题:工程师之间的生产力差距是否会被进一步放大?通才与专才的价值结构是否会发生变化?以及整个软件行业在 2026 年将面临怎样的内容与质量冲击。
Karpathy 描述了一次极为迅速的个人工作流转变:在 2025 年 11 月,他仍以手写代码为主,仅在约 20% 的场景中依赖 AI Agent;而到 12 月,这一比例几乎完全反转,绝大多数代码由 AI Agent 生成,人类主要承担编辑、校对和方向性修正的角色。
这意味着,编程行为本身正在从“逐行构造逻辑”,转变为“用自然语言描述意图与约束”。他直言,这种方式在心理上并不完全舒适,但从结果看,其效率优势极为显著。这是他二十多年编程生涯中最剧烈的一次范式变化,而且发生得极快。
Karpathy 对“IDE 将被淘汰”或“多 AI Agent 可全自动完成工程”的观点持明显保留态度。在他看来,当前模型仍然会频繁犯错,且错误类型已经从传统的语法错误,转向更隐蔽的概念性错误和错误假设。
AI Agent 往往会在未经澄清的前提下自行做出假设,并沿着错误方向持续推进;它们缺乏主动质疑、暴露矛盾或权衡利弊的能力,也倾向于迎合用户,而非提出反对意见。此外,AI Agent 还普遍存在过度设计、抽象层级膨胀、遗留无用代码等工程问题。
因此,在现阶段,高质量的软件工程仍然离不开工程师的强监督,IDE 依然是不可或缺的核心工具。
Karpathy 特别强调,AI Agent 在面对复杂问题时展现出的“不知疲倦的持续尝试”是一种全新的工程体验。它们不会因为短期失败而中断,而是不断调整策略,直到找到可行解。
在这种模式下,限制生产力的关键瓶颈,往往不再是智能本身,而是持续投入注意力与耐力的成本。
Karpathy 认为,LLM 带来的提升并不适合用单一的“效率倍数”衡量。更重要的变化在于任务边界的扩展:
一方面,许多过去“不值得专门写代码”的小工具现在可以快速完成;另一方面,一些原本因知识门槛而放弃的领域,也变得可以直接尝试。
Karpathy 总结了一条关键方法论:与其告诉 AI Agent 具体执行步骤,不如明确成功标准,并允许其在循环中自行逼近目标。这种声明式使用方式,结合测试驱动和自动验证,能够显著放大 AI Agent 的整体效能。
Karpathy 指出,使用 AI Agent 后,编程体验本身发生了变化。大量重复、机械、易卡壳的工作被剥离,工程师可以将注意力集中在设计、探索与创造上。这种变化也可能进一步分化工程师群体:偏好“写代码过程”的人,与偏好“构建产品结果”的人。
他也清醒地指出,长期依赖代码生成,会削弱个人的手写能力。生成代码与理解、评审代码,本质上是两种不同的认知技能,这一差异正在变得越来越明显。
Karpathy 预测,2026 年可能会成为一个“低质内容爆发”的节点:GitHub、博客平台、学术预印本以及各类社交媒体,都可能被大量 AI 生成内容充斥。行业需要重新建立筛选、评估与信任机制。
Karpathy 在笔记中提出了一些尚未有明确答案的问题:
Karpathy 的总体判断是:在 2025 年底,AI Agent(尤其是 Claude、Codex 等工具)的能力已经跨过了某个关键门槛,软件工程正式进入新的发展阶段。智能能力的跃迁速度,已经明显快于工具链、流程与组织结构的适配速度。
2026 年,很可能将是整个行业消化、吸收并重新构建这一能力的一年。
Karpathy原文:https://x.com/karpathy/status/2015883857489522876