17611538698
info@21cto.com

创建 Claude Code 的 Anthropic 负责人表示,他放弃了提示词——现在只写循环

人工智能 0 14 12小时前
图片

导读:“循环工程”(即设计自动化代理工作流程,不再是手动发布提示词的实践)正在重塑开发者在 2026 年使用 Claude Code 以及 OpenAI Codex 的方式。

本周,人工智能开发者工具领域发展最快的讨论始于一份新职位描述。

Anthropic 公司Claude Code的负责人Boris Cherny表示,他不再直接向 Claude 发出指令,“我现在的工作就是写循环”。而 Peter Steinberger敦促开发者们开始设计用于提示其AI 代理的循环。

上周日,谷歌软件工程师 Addy Osmani发表了一篇文章,将这种模式命名为:循环工程(loop engineering

名称本身并不重要,重要的是它所揭示的内容。编码代理正从交互式助手演变为长时间运行的执行系统,而 OpenAI 和 Anthropic 花费数月时间发布了循环的六个基本构建模块。

图片
我们将视频附录如下:

从机器操作到生产线设计


Boris Cherny将循环工程定义为“取代自己,成为提示智能体的人”。其核心是一种编排模式,它结合了定时执行、隔离工作区、验证智能体和持久化内存,将编码智能体转变为自主软件工作者。
在过去的两年时间里,与编码智能体合作意味着需要不断地输入提示信息,而人则同时扮演着调度员和质量把关人的角色。

循环工程的核心是一种编排模式,它结合了计划执行、隔离工作区、验证代理和持久内存,将编码代理转变为自主软件工作者。

循环模式颠覆了这种结构,最接近的类比是从操作车床转变为设计车床所在的生产线。循环模式会按计划发现工作,用第二个代理验证结果,并将状态写入文件,以便明天的运行可以从今天中断的地方继续。它比奥斯曼尼早期的线束工程模式高一个层次。

两种产品都使用相同的基础构件。


循环工程已经从一种非正式的模式发展成为一种正式的实践,因为构建模块现在都包含在产品内部,而不在是自定义脚本中。

Osmani 将六个基本元素映射到 Claude Code 与 Codex,而且映射关系几乎是完全相同的。

请看下表所示:

原始Loop循环的作业
Codex
Claude Code
自动化计划性发现和分诊自动化选项卡,其中包含一个分诊收件箱计划任务、/loop钩子、GitHub Actions
工作树隔离平行代理每个线程内置工作树git worktree子代理的工作树隔离
技能将项目知识编码化SKILL.md代理人技能SKILL.md代理技能
连接器联系外部工具MCP连接器和插件MCP服务器与插件
次级代理人将制图者与检查者分开子代理定义于.codex/agents/次级代理.claude/agents/,代理团队
记忆运行间保持状态AGENTS.md记忆功能,或通过连接器进行线性连接CLAUDE.md,自动记忆,或通过 MCP 进行线性记忆

这两款产品都提供了一个命令:/goal,它使智能体持续工作,直到满足可验证的停止条件为止,其中 Claude Code 使用单独的模型来评估结果。

借助自动化,OpenAI 使 Codex 用户能够将计划发现作为一项重要的功能来运行。而Anthropic于 4 月份推出了Claude Code 的例程以及动态工作流。

一些团队通过让 Claude 编写自己的编排脚本并运行并行子代理来测试动态工作流。借助这些基本功能,开发人员可以将周期性维护转换为计划的自主工作流,团队可以通过隔离的工作树并行运行代理,而不会破坏主分支。工具构建者宣布组装完成时,这样的技术栈开始迅速传播开来。

验证是赢得信任的关键环节。


循环中最关键的设计选择,是将编写代码的代理与检查代码的代理分开。模型自行评估输出过于宽松,因此需要第二个具有不同指令的代理来捕获第一个代理自身推理产生的Bug。

Anthropic在其针对长时间运行代理的框架工作中详细描述了这种分离型方法。

在 Osmani 的实例中,早晨的自动化流程会对前一天的持续集成 (CI) 失败进行分类,并派出一个子代理在独立的工作树中为每个失败编写修复方案,同时派出另一个子代理根据项目的测试用例进行审查。

Ramp 的Inspect六个月前就构建了这种定制化的基础设施,如今它作为第一方功能被两个生态系统采用,这表明闭环运行正在成为默认的模式。

成本、正确性和理解债务


有意思的是,开发者们在不到 18 个月的时间里,就经历了从即时工程到上下文工程,再到利用工程,最终到循环工程的转变。

2026 年循环的调度层使用的是传统的调度器,例如 cron。中间的决策逻辑区分了两者:cron 作业运行固定的脚本,而循环则运行的是一个模型,该模型读取当前状态并选择下一步操作。

Osmani 比他引发的讨论更为谨慎。
他向开发者们警告说,Token成本差异巨大,而且无人值守的循环运行也意味着无人值守的错误。他最严厉的警告是关于理解债务,即当系统发布你从未阅读过的代码时,理解鸿沟就会扩大。
两个软件工程师运行相同的循环,可能会得到截然相反的结果:一个工程师在理解代码的情况下工作效率更高,而另一个工程师则完全回避理解。

前路漫漫


开发者可以从一个定时分诊自动化流程和一个验证子代理入手,以极少的Token投入获得最大的价值。

当前,Cursor、Google 的Antigravity和 GitHub 的新应用 Copilot都支持代理编排,但目前还没有哪个应用将循环作为其工作单元。

这些平台之间的关键区别在于从模型本身转向围绕模型的循环,因为调度、验证和内存现在决定了最终交付的内容。

循环工程有望成为人工智能辅助软件开发的编排层,而能够使循环定义可移植的技术供应商将占据业界领先之地位。

作者:洛逸

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。

分享到微信