导读:著名程序员兼黑客乔治 · 霍茨(George Hotz)于 5 月 24 日发布博文,他指出在当代软件开发过程中,AI 编程智能体可能是代价最高的错误之一。
著名程序员兼黑客乔治·霍茨警告说,软件开发中的人工智能代理弊大于利。他表示自己现在已经加入了“立昆/马库斯阵营(LeCun & Marcus camp)”,指的是人工智能研究员杨·立昆和加里·马库斯,他们怀疑人工智能代理是否真的能够达到智能水平。
在标题为《永恒的九月泥泞期》的博文中,霍茨认为在软件开发中使用人工智能代理将成为业内代价最昂贵的错误之一。他花了六个月的时间测试各种大模型和工具,包括 tinygrad项目。他的结论是,LLM(大语言模型)虽然能够快速交付原型,但在细节处理上却是漏洞百出。
他表示,大型组织尤其容易受到威胁,因为能力较弱的开发人员根本无法发现输出结果中的缺陷。霍茨认为,如今的语言模型永远无法真正实现编码,因此人们真正需要的是世界模型 ,而大语言模型是“复杂的统计模型”,旨在“模拟编程的分布”。
霍茨表示,输出结果存在缺陷,但这种缺陷“越来越难以察觉”,这正是人们对日益精确的统计模型所预期的。他认为,诸如句法和语法之类的质量指标已经变得毫无用处,因为人工智能生成的产物并非通过与人类相同的过程产生。他举例说,有些模型会简单地注释掉失败的测试,然后报告所有测试都通过了。
霍茨的立场转变已经有一段时间: 他从LLM的乐观主义者(“o1-preview是第一个能够进行编程的模型”)变成了怀疑论者。霍茨引用的杨立昆最近也以相似论点否认了LLM拥有的“智能”:智能意味着在陌生的环境中找到解决方案,而不是以不同的准确度模仿现有的解决方案。
但是,安德烈·卡帕西(Andrej Karpathy)作为人工智能领域最知名的研究员之一,他的观点与霍茨截然相反。2025年秋季,他也认为智能体行不通。然而,12月GPT-5.4和Opus 4.6的发布彻底改变了他的看法:人工智能智能体已经彻底改变了编程。几天前,卡帕西加入了Anthropic,离开了他的创业公司。他预计未来几年将是“变革性的”。
在最近的一期播客节目中,安德烈·卡帕西再次强调了这一点。他说,任何正确使用人工智能代理的人都可以将生产力提高十倍以上。
但是,卡帕西也证实了霍茨对代码质量的担忧:“当你真正查看代码时,有时我会感到有点心惊胆战,因为代码并不总是那么出色。它非常臃肿,充斥着大量的复制粘贴,存在着脆弱且笨拙的抽象,虽然它能运行,但真的很糟糕。”卡帕西认为,规划和理解仍然需要人类的专业知识。
一位化名为“roon”的OpenAI开发者今年早些时候也表达了对Hotz担忧的看法,他以一种略显不同寻常的方式回应。他表示,人工智能会犯错,甚至会犯足以导致整个系统崩溃的严重错误。这些漏洞虽然难以发现,但最终都会被修复。他还说,开发者将很快就会停止手动审查代码。
作者:洛逸
本篇文章为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。
请扫描二维码,使用微信支付哦。