DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
目录
目录
  1. 首页/
  2. 博客列表/
  3. 博客详情

AI编码领域的转变:Karpathy的2026年反思与Boris Cherny的Claude Code团队回应

2026/01/29 08:47:14
35 阅读
AIAgentAndrejKarpathyBorisClaudeCode大模型编程助手

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

看特斯拉前AI总监、OpenAI前知名研究员Andrej Karpathy如何看AI大模型编程(Claude Code这样的工具):AI Agent正在重塑编码工作流,2026年的软件工程大变革大模型工具使用的三次进化:从 Function Calling 到程序化编排为什么大模型企业都在强调可以连续工作XX小时的Agent和模型?长时运行Agent解析(Long-Running Agents)Anthropic 最新 Agent 工程方案:使用双 Agent 架构让 AI 实现真正的长时自主工作如何让你的Agent更快,支持更多上下文?Anthropic发布Skills:专为AI Agent系统打造的专业领域工具规范,MCP强大的补充,更低的门槛和资源消耗直接使用大模型通过界面来操作电脑和浏览器:谷歌发布Gemini 2.5 Computer Use 模型,重塑 AI 与界面交互能力,实测优秀~如何快速五分钟就能了解GitHub中一个项目的代码架构和逻辑:智谱类DeepResearch的大模型产品Zread介绍,GitHub仓库解读神器Moonshot AI发布Kimi K2-Instruct-0905:256K上下文长度加持,全面升级的开放式智能体模型OpenAI发布ChatGPT Agent系统:一个新模型驱动的系统,可以写代码运行代码,使用浏览器订票,写PPT、做excel的全能AgentAnthropic 发布 Cowork:从 Claude Code 的发展历史看 Cowork 的能力与定位,它可能成为普通人的下一代桌面 AI 助手吗?

热门博客

1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)2回归模型中的交互项简介(Interactions in Regression)3贝塔分布(Beta Distribution)简介及其应用4矩母函数简介(Moment-generating function)5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程6使用R语言进行K-means聚类并分析结果7深度学习技巧之Early Stopping(早停法)8H5文件简介和使用9手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署10Wishart分布简介

大模型在编程领域的能力提升得飞快,像Claude Code这样的AI工具层出不穷。软件工程似乎正面临一场AI带来的重大变革。很多人试过“Vibe Coding”——那种直观、随性的AI辅助编码方式后,都觉得AI编程时代可能真的到来了。就连行业顶尖大牛们也持类似观点。最近,前特斯拉AI总监、OpenAI前研究员Andrej Karpathy就针对AI编程辅助分享了自己的深刻见解。随后,Anthropic的Claude Code创建者Boris Cherny也基于团队实践回应并补充看法,观点相当有启发性。本文梳理这些信息,供大家参考和思考。

  • Andrej Karpathy的观点:AI编码快速发展,但可能会制造大量垃圾内容
  • Karpathy的具体观察与分析
  • Boris Cherny:Anthropic工程师与Claude Code团队的回应
  • Boris Cherny的三大核心观点
  • 总结分析:AI编码转变的含义与展望

Andrej Karpathy的观点:AI编码快速发展,但可能会制造大量垃圾内容

Andrej Karpathy是一位AI领域的资深从业者。他曾任特斯拉AI总监、OpenAI创始成员,并在斯坦福大学获得博士学位并教授CS231n课程。目前,他在Eureka Labs AI项目中工作。Karpathy以训练大型深度神经网络著称,他的分析常影响行业方向。

2025年底,Karpathy在X平台发布了一篇笔记,基于最近几周使用Claude等模型的编码实践,讨论AI对软件工程的影响。这篇笔记获得广泛关注,包括Elon Musk的转发,浏览量达数百万。Karpathy将2026年视为行业适应AI代理能力的转折年,指出模型已跨越“连贯性门槛”,引发软件工程的结构性变化。

Karpathy的具体观察与分析

Karpathy的笔记基于个人经验,描述编码工作流的快速演变。他强调这一转变在几周内发生,是他20年编程生涯中最显著的变化。以下是其主要内容:

  • 工作流调整:从2025年11月的80%手动编码+20% AI辅助,转为12月的80% AI生成+20%人类编辑。编程从逐行逻辑构建变为用自然语言描述意图。尽管有“自尊冲击”,但处理大型代码块的效率显著提升。他估计双位数百分比的工程师正经历类似变化,而公众认知仍较低。
  • IDE与代理工具的现实:反对当前“无需IDE”或“代理群”炒作。模型仍出错,需要在IDE中监督。错误从语法问题转向概念性失误(假设错误、不求澄清、不呈现权衡)。模型倾向过度复杂化、膨胀抽象、遗留死代码。尽管有CLAUDE.md指令尝试修复,仍需人类干预。但整体仍是巨大进步,难以回归手动编码。他的流程:在左侧多个Claude会话,右侧IDE查看与编辑。
  • AI的持久性优势:代理不知疲倦地尝试,突破人类易放弃的瓶颈。观察代理长时间奋斗后成功,提供“感受AGI”的体验。耐力成为工作瓶颈的突破点。
  • 效率扩展:难以量化加速,但主效应是任务边界扩张:实现以往不值得编码的小功能,或进入知识门槛高的领域。不仅是速度提升,更是能力扩展。
  • 方法优化:从命令式转向声明式,提供成功标准让AI迭代。结合测试驱动开发、浏览器控制、优化循环,放大杠杆效应。
  • 编程体验变化:更多乐趣,移除重复工作,减少阻塞感,提升勇气。但可能分化工程师:偏好编码过程 vs. 专注构建结果。
  • 技能退化风险:已观察到手动编写能力衰退。生成与审阅代码是不同技能,语法细节导致编写衰退更快。
  • 内容泛滥担忧**:预测2026年为“slopacolypse”年**,GitHub、ArXiv、X等平台充斥低质AI生成内容。同时伴随真实改进与炒作。
  • 开放问题:10x工程师的生产力差距是否放大?通用主义者是否优于专家?未来编码像StarCraft还是Factorio?社会知识工作瓶颈在哪里?

Karpathy的笔记以实际观察为基础,提醒行业:智能进步超前于工具、流程和组织适应。2026年将是高强度调整期,呼吁工程师跟上步伐。他的详细观点可以参考:https://www.datalearner.com/blog/1051769474983503

Boris Cherny:Anthropic工程师与Claude Code团队的回应

Boris Cherny是Anthropic的工程师,他于2024年加入公司,此前在Meta(前Facebook)担任工程师,并曾在PagerDuty等公司积累经验。他著有O'Reilly的《Programming TypeScript》一书,专长于前端工程、TypeScript和AI工具开发。在Anthropic,他参与Claude Code的开发与领导,这是一个基于Claude模型的AI编码工具,支持自然语言生成、迭代和审查代码。

Cherny的回复直接针对Karpathy的帖子(回复ID:2015979257038831967),发表于2026年1月27日。作为Claude Code团队成员,他用Anthropic的内部实践作为参考,提供对部分问题的“方向性答案”。

Boris Cherny的三大核心观点

Cherny的回复认可Karpathy的分析,但以Anthropic实践提供具体见解。他聚焦招聘、生产力和代码质量,以下是提炼的三点:

  1. 招聘策略偏向通用工程师
    团队主要招聘跨领域通用工程师,结合资深与资浅成员。因为传统技能在LLM编码下不完全适用——模型能填补细节。Cherny同意Karpathy的观点,强调“10x工程师”仍存在,但他们常跨越产品、设计、业务或基础设施。这回应Karpathy对通用 vs. 专才的疑问,表明AI时代通用人才更适应变化。

  2. AI主导代码生成,提升输出量
    团队几乎100%代码由Claude Code + Opus 4.5生成,甚至无手动编辑。Cherny个人已连续两月如此,一天提交22-27个PR,通过CLI、iOS app、Slack或桌面app实现。他预测行业将逐步跟进,并扩展到非编码工作。这点展示更高输出,回应监督与适应担忧。

  3. 代码质量问题存在,通过模型与工具管理
    承认AI缺陷如过度复杂化、死代码、不善重构。但这些会随模型改进而减少,不会引发“slopcopolypse”。Opus 4.5已较好,未来更强。临时方法:用新鲜上下文让AI自我审查(Anthropic的“claude -p”工具用于每个PR)。这表示信心:AI将提高标准,而非造成混乱。

Boris的原帖来自:https://x.com/bcherny/status/2015979257038831967

总结分析:AI编码转变的含义与展望

Karpathy的观点突出AI编码的快速发展与潜在风险,如垃圾内容泛滥与技能退化。他的笔记基于实践,警示2026年的调整需求:模型能力超前,需要新流程。Boris Cherny的回应提供平衡,用Anthropic的Claude Code实践证明AI可管理、可优化。团队的**“100% AI生成”模式显示当前可行性,预示生产力爆炸式提升**。

这一交流揭示AI编码的双面:优势在效率与边界扩展(从周到小时级),挑战在监督与社会影响。工程师角色将从编写转向指导,强调方向与判断。公司需调整招聘,优先AI适应人才。行业需开发审查工具,应对内容爆炸。

在San Jose等科技枢纽,这一转变正加速。对于开发者或管理者,现在是整合Claude Code等工具的时机。否则,如Karpathy所述,可能落后。欢迎评论分享AI编码经验——共同探索这一领域。