DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Contents
Contents
  1. Home/
  2. Blog List/
  3. Blog Detail

看特斯拉前AI总监、OpenAI前知名研究员Andrej Karpathy如何看AI大模型编程(Claude Code这样的工具):AI Agent正在重塑编码工作流,2026年的软件工程大变革

2026/01/27 08:49:43
460 views
AIAgentAndrejKarpathyClaudeCode大模型编程助手

Andrej Karpathy 是 AI 领域极具影响力的研究者,曾任特斯拉 AI 总监,并在 OpenAI 从事核心研究工作。2025 年底,他基于近几周密集使用 Claude 等大型语言模型(尤其是偏向 Claude Code 场景)的真实编码体验,撰写了一份反思笔记,系统性讨论了软件工程正在从“人主导编码”向“AI Agent 主导执行”转变的过程,以及这一转变带来的效率跃迁、方法论变化与潜在风险。

摘要(Abstract)
本文系统梳理了 Andrej Karpathy 在 2025 年底关于 AI Agent 编程的核心观点。Karpathy 基于其近期大量使用 Claude Code 等大型语言模型的真实工程经验,指出软件工程正在从“人主导的手动编码”转向“以 AI Agent 为执行主体、人类定义目标与约束”的新范式。文章总结了 AI Agent 在编码效率、工作流、工程方法论上的实际优势,同时也客观分析了其在概念性错误、过度抽象、监督成本、工程质量与个人技能退化等方面的现实问题。Karpathy 进一步提出,2026 年将是 AI Agent 能力被行业系统性消化的一年,工程师生产力差距、通才与专才分工、以及软件内容质量结构都可能发生深刻变化。

Andrej Karpathy 对大模型编程的核心观点总结

Karpathy 在笔记中坦言,他对 LLM 编码能力在短时间内取得的跃迁感到震惊,并迅速调整了自己的工作方式:从以手动编写代码为主,转向主要通过自然语言“指挥”AI Agent 生成和迭代代码。尽管这一转变在心理上伴随着一定的不适(例如对个人编码能力的自尊冲击),但他明确认为,这是一次量级极高的生产力提升,甚至可以说重塑了其二十余年的编程习惯。

他同时指出,当前的 AI Agent 仍然存在概念性错误、过度抽象和缺乏自我反思等问题,需要工程师保持高度监督。但即便如此,AI Agent 展现出的“持续执行、反复尝试直至成功”的特性,已经带来了强烈的“AGI 体验”。他也因此提出了一系列更宏观的问题:工程师之间的生产力差距是否会被进一步放大?通才与专才的价值结构是否会发生变化?以及整个软件行业在 2026 年将面临怎样的内容与质量冲击。


Andrej Karpathy 对大模型编程的详细观点解析

编码工作流的根本性转变:从“写代码”到“用自然语言编程”

Karpathy 描述了一次极为迅速的个人工作流转变:在 2025 年 11 月,他仍以手写代码为主,仅在约 20% 的场景中依赖 AI Agent;而到 12 月,这一比例几乎完全反转,绝大多数代码由 AI Agent 生成,人类主要承担编辑、校对和方向性修正的角色。

这意味着,编程行为本身正在从“逐行构造逻辑”,转变为“用自然语言描述意图与约束”。他直言,这种方式在心理上并不完全舒适,但从结果看,其效率优势极为显著。这是他二十多年编程生涯中最剧烈的一次范式变化,而且发生得极快。

关于 IDE、多 AI Agent 与现实约束:炒作之外仍需强监督

Karpathy 对“IDE 将被淘汰”或“多 AI Agent 可全自动完成工程”的观点持明显保留态度。在他看来,当前模型仍然会频繁犯错,且错误类型已经从传统的语法错误,转向更隐蔽的概念性错误和错误假设。

AI Agent 往往会在未经澄清的前提下自行做出假设,并沿着错误方向持续推进;它们缺乏主动质疑、暴露矛盾或权衡利弊的能力,也倾向于迎合用户,而非提出反对意见。此外,AI Agent 还普遍存在过度设计、抽象层级膨胀、遗留无用代码等工程问题。

因此,在现阶段,高质量的软件工程仍然离不开工程师的强监督,IDE 依然是不可或缺的核心工具。

AI Agent 的耐力优势:持续迭代本身成为突破瓶颈的关键

Karpathy 特别强调,AI Agent 在面对复杂问题时展现出的“不知疲倦的持续尝试”是一种全新的工程体验。它们不会因为短期失败而中断,而是不断调整策略,直到找到可行解。

在这种模式下,限制生产力的关键瓶颈,往往不再是智能本身,而是持续投入注意力与耐力的成本。

加速效应的本质:不是更快完成同样的事,而是能做更多事

Karpathy 认为,LLM 带来的提升并不适合用单一的“效率倍数”衡量。更重要的变化在于任务边界的扩展:
一方面,许多过去“不值得专门写代码”的小工具现在可以快速完成;另一方面,一些原本因知识门槛而放弃的领域,也变得可以直接尝试。

放大 AI Agent 杠杆的关键:从命令式到声明式

Karpathy 总结了一条关键方法论:与其告诉 AI Agent 具体执行步骤,不如明确成功标准,并允许其在循环中自行逼近目标。这种声明式使用方式,结合测试驱动和自动验证,能够显著放大 AI Agent 的整体效能。

编程体验的变化:更多创造,更少消耗

Karpathy 指出,使用 AI Agent 后,编程体验本身发生了变化。大量重复、机械、易卡壳的工作被剥离,工程师可以将注意力集中在设计、探索与创造上。这种变化也可能进一步分化工程师群体:偏好“写代码过程”的人,与偏好“构建产品结果”的人。

技能退化的现实风险:写代码与读代码是不同能力

他也清醒地指出,长期依赖代码生成,会削弱个人的手写能力。生成代码与理解、评审代码,本质上是两种不同的认知技能,这一差异正在变得越来越明显。

低质内容的冲击:平台级噪声不可避免

Karpathy 预测,2026 年可能会成为一个“低质内容爆发”的节点:GitHub、博客平台、学术预印本以及各类社交媒体,都可能被大量 AI 生成内容充斥。行业需要重新建立筛选、评估与信任机制。

面向未来的关键问题

Karpathy 在笔记中提出了一些尚未有明确答案的问题:

  • AI Agent 加持下,工程师之间的生产力差距是否会被显著拉大?
  • 通才在 LLM 时代是否会相对专才更具优势?
  • 未来的编程体验会更像哪种活动?
  • 社会中有多少环节,受限于数字化知识工作的瓶颈?

总结:门槛已被跨过,系统性变化才刚开始

Karpathy 的总体判断是:在 2025 年底,AI Agent(尤其是 Claude、Codex 等工具)的能力已经跨过了某个关键门槛,软件工程正式进入新的发展阶段。智能能力的跃迁速度,已经明显快于工具链、流程与组织结构的适配速度。

2026 年,很可能将是整个行业消化、吸收并重新构建这一能力的一年。

Karpathy原文:https://x.com/karpathy/status/2015883857489522876

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

  • Moltbook 是什么?一个专为 AI Agent 或者说是 OpenClaw(前身为 Clawdbot 或 Moltbot)设计的社交网络,以及最有趣的讨论案例收集
  • AI编码领域的转变:Karpathy的2026年反思与Boris Cherny的Claude Code团队回应
  • 大模型工具使用的三次进化:从 Function Calling 到程序化编排
  • 为什么大模型企业都在强调可以连续工作XX小时的Agent和模型?长时运行Agent解析(Long-Running Agents)
  • Anthropic 最新 Agent 工程方案:使用双 Agent 架构让 AI 实现真正的长时自主工作
  • 如何让你的Agent更快,支持更多上下文?Anthropic发布Skills:专为AI Agent系统打造的专业领域工具规范,MCP强大的补充,更低的门槛和资源消耗
  • 直接使用大模型通过界面来操作电脑和浏览器:谷歌发布Gemini 2.5 Computer Use 模型,重塑 AI 与界面交互能力,实测优秀~
  • 如何快速五分钟就能了解GitHub中一个项目的代码架构和逻辑:智谱类DeepResearch的大模型产品Zread介绍,GitHub仓库解读神器

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署