17611538698
info@21cto.com

Cursor CEO称用GPT-5.2开发新浏览器实验“成功”

导读:Cursor 的 25 岁首席执行官 Michael Truell 与他的团队协调了数百个GPT-5.2 代理,从零开始构建了一个“功能齐全的网络浏览器”。

如果人工智能代理连续“不间断”工作了一整周。结果将会如何?据称,它生成了超过300万行代码,分布在数千个文件中。

它使用了 OpenAI 的 GPT-5.2,这是一款专为长时间自主工作而设计的模型。

GPT-5.2于 2025 年 12 月发布, 其人工智能编码能力受到广泛赞誉。

Cursor的首席执行官 Truell 称,GPT-5.2 正好满足了自己项目的要求:能够专注于任务、完整地实现功能,并能长时间自主工作。 

他称,Cursor的新项目目标将是构建一个全新的Web浏览器,拥有自己的渲染引擎和核心子系统。 

GPT-5.2 驱动 AI 智能体造浏览器


2026年1月14日,Cursor 发布了一篇题为“扩展长时间运行的自主编码”的博客文章(https://cursor.com/blog/scaling-agents)。


在文中,他们谈到了“自主运行编码代理数周”的实验,明确目标:

了解我们将智能编码的边界推进到什么程度,从而完成那些通常需要人类团队花费数月时间才能完成的项目。

他们讨论了尝试过的一些方法,包括这些方法失败的原因,以及如何解决遇到的困难。

最终,他们找到了方法,“解决了我们的大部分协调问题,使能够在没有任何单一代理的情况下扩展到非常大的项目”,提到将要完成以下结果:

为了测试这套系统,我们给它设定了一个雄心勃勃的目标:从零开始构建一个网页浏览器。代理程序运行了近一周,编写了超过100万行代码,分布在1000个文件中。

可在GitHub上查看源代码(https://github.com/wilsonzlin/fastrender)。

图片

代码库包含基本的浏览器组件,例如 HTML 解析、CSS 层叠和布局、文本塑形、绘制机制,甚至还有一个自定义的 JavaScript 虚拟机。 

代码无法编译


事情走到这里就变得有点扑朔迷离了。

他们声称“尽管代码库庞大,初级用户仍然可以理解,并取得实质性进展”以及“数百个工作进程并发运行,向同一分支推送代码,冲突极少”。

但是,Cursor从未真正说明这款软件编译是否成功,它是否真的有效?你能自己运行这个浏览器吗?人们不得而知,他们也从未明确说明。

然后,Truell跑在X上解释说:“这*勉强*有效! ”

图片

然后写道:“虽然这看起来像是一张简单的屏幕截图,但从头开始构建一个浏览器是非常困难的。”

这款浏览器确实没有能够正常运行。错误翻译成中文类似于这样:

错误:由于存在 34 个错误,无法编译“fastrender”(库);发出 94 个警告

总体而言,如果你尝试编译它,会发现它离成为一个功能齐全的浏览器还差得很远,然后你会下结论,它根本就没有可能成功编译。

有多次的 GitHub Actions 运行main显示失败(包括工作流文件错误),独立的构建尝试报告了数十个编译器错误。我们将最近的 PR 都合并了,但 CI 失败。

从最近的提交回溯到 100 次提交的 Git 历史记录中,人们找不到一个可以干净编译的提交。

不确定他们在这个代码库上部署的“AI代理”究竟做了什么,但它们从不能运行过“cargo build”命令,更别提“cargo check”了,因为这两个命令暴露出数十个错误(如果解决这些错误,错误数量肯定会激增)以及大约100个警告。

如果编译错误还不足以说明问题,那么深入研究代码库后,任何软件开发人员都会非常清楚地发现,这些代码根本不是经过精心设计的。

它们通常被称为“AI垃圾代码”,质量低劣,虽然确实代表了某种东西,但背后没有任何意图,连第一次次编译都做不到。

Cursor开始称讨论下一步该做什么,但却只字未提如何运行、预期结果、工作原理或其他任何相关内容。

Cursor 的博客除了提供代码仓库链接外,既没有提供可复现的演示,也没有提供任何已知的有效版本来验证截图。

无论其意图如何,Cursor 的博客文章给人一种原型功能完备的错觉,却忽略了此类声明应有的基本可复现性特征。但是,他们从未明确声称原型功能确实有效。

文章的最后写道:

“核心问题,即我们能否通过投入更多智能体来扩展自主编码,其答案比我们预期的要乐观得多。”

他们目前所证明的是Agent可以同时输出数百万个Token,但最终仍然无法得到真正有效的东西。

“浏览器实验”无需与 Chrome 相媲美。一个合理的最低标准是:它能在受支持的工具链上编译,并且能够渲染一个简单的 HTML 文件。

Cursor 的帖子并没有达到这个标准,目前公开的构建尝试也从未成功。

HackerNews上的一位开发者表示,在生成的代码中定位 JavaScript 引擎或 DOM 实现等核心组件非常困难。 

此外,整个规划过程也需要真正的开发人员参与。代理程序并非自发决定浏览器的设计方式,而是由人来定义目标、角色和工作流程。

突破与局限的双重启示


Cursor 很聪明,并未说过“这款浏览器已准备好投入生产环境”,但他们将其描述为“从零开始构建网络浏览器”和“取得了有意义的进展”,然后使用屏幕截图和“极其困难”的语言,想要给人一种印象,即这项实验实际上取得了成功。

他们最接近说这是一次成功的说法是:

“数百个AI代理可以在同一代码库上协同工作数周,在雄心勃勃的项目上取得真正的进展。“

但是,这种离奇的说法没有任何证据支持。博文中既没有提供可用的提交版本,也没有提供构建说明,甚至连一个可以复现问题的演示都没有。

我不认为有人会指望这款浏览器成为下一个 Chrome,但如果你声称自己开发了一款浏览器,那么它至少应该能够证明自己能够编译并加载一个基本的 HTML 文件。

Cursor 的浏览器实验虽然是个未知数,但多智能体协调技术被验证是成功的,也许他们会将其集成到另外的主要产品中。 

作者:行动的大雄

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信