Cursor 疯狂实验:用 GPT-5.2 花了一个星期在 Cursor 中开发了一个300万行代码的浏览器以及Claude Opus与GPT-5.2、GPT-5.2-Codex模型在Vibe Coding方面有什么差异
在当下的开发圈子里,“Vibe Coding”(氛围编程?中文似乎还没有统一翻译)这个词正变得越来越火。以 Claude Code 为首的工具展现出了惊人的能力,让很多开发者体验到了前所未有的流畅感——你只需要描述意图,代码似乎就自然而然地“流淌”了出来。
然而,这种快感背后也隐藏着巨大的认知模糊区。大多数人其实并不清楚这些 AI Agent 的实际能力边界在哪里。比如,**OpenAI 的 Codex 和 Anthropic 的 Claude 在处理复杂工程时到底有什么本质区别?**它们是只能写写脚本和简单的 CRUD,还是真的能承载从零构建大型系统的重任?

就在大家还在争论 AI 编程上限的时候,Cursor 团队发布了一份非常值得大家关注的内部测试报告,展示了当我们将 Agent 的规模和运行时间推向极致时,会发生什么。这不仅仅是简单的代码生成,而是让 AI 像人类团队一样协作,构建百万行级别的项目。这项实验为我们揭示了 AI 在编码领域的潜力与局限,值得每位开发者关注。
Cursor 的一次“极限编程”实验:让 AI 连续跑一周做一个浏览器
Cursor 的团队构建了一个实验:让集成了 GPT-5.2 的 Agent 在 Cursor 平台上连续运行 近一周(7 天不间断),目标是从零开始构建一个 Web 浏览器。这个浏览器不是简单的演示,而是真正从头实现很多功能,包括:


