Cursor 疯狂实验:用 GPT-5.2 花了一个星期在 Cursor 中开发了一个300万行代码的浏览器以及Claude Opus与GPT-5.2、GPT-5.2-Codex模型在Vibe Coding方面有什么差异
在当下的开发圈子里,“Vibe Coding”(氛围编程?中文似乎还没有统一翻译)这个词正变得越来越火。以 Claude Code 为首的工具展现出了惊人的能力,让很多开发者体验到了前所未有的流畅感——你只需要描述意图,代码似乎就自然而然地“流淌”了出来。
然而,这种快感背后也隐藏着巨大的认知模糊区。大多数人其实并不清楚这些 AI Agent 的实际能力边界在哪里。比如,**OpenAI 的 Codex 和 Anthropic 的 Claude 在处理复杂工程时到底有什么本质区别?**它们是只能写写脚本和简单的 CRUD,还是真的能承载从零构建大型系统的重任?

就在大家还在争论 AI 编程上限的时候,Cursor 团队发布了一份非常值得大家关注的内部测试报告,展示了当我们将 Agent 的规模和运行时间推向极致时,会发生什么。这不仅仅是简单的代码生成,而是让 AI 像人类团队一样协作,构建百万行级别的项目。这项实验为我们揭示了 AI 在编码领域的潜力与局限,值得每位开发者关注。


