Anthropic 发布 Claude Opus 4.5

Anthropic在11月25号发布了其最大Claude模型Opus的最新版本v4.5。

Claude Opus 4.5在处理复杂推理方面比之前的Claude模型表现更佳，并在智能体工具使用、计算机使用、新型问题解决等方面均有所改进。

这家公司表示，新模型的早期测试人员称，它能更好地处理模糊情况，并在无需人工干预的情况下权衡利弊。

Anthropic团队在一篇文章中如此写道：“他们告诉我们，当遇到复杂的多系统漏洞时，Opus 4.5 会自动找出修复方法。他们说，几周前 Sonnet 4.5 几乎无法完成的任务，现在都能轻松搞定。总而言之，我们的测试人员告诉我们，Opus 4.5 真的‘懂行’。”

此次发布恰逢 Claude API 中引入新的“努力度”参数，开发者可以决定 Claude 在解决问题上投入多少努力。

据 Anthropic 称，Opus 4.5 即使在最高努力度下，解决问题所需的令牌数量也显著少于其前代版本。例如，在中等努力度下，Opus 4.5 在 SWE-bench Verified 测试中与 Sonnet 4.5 的得分持平，但输出令牌数量减少了 76%；而在最高努力度下，Opus 4.5 的输出令牌数量减少了 48%，性能却比 Sonnet 4.5 高出 4.3%。

Claude Opus 4.5 可以像 SQL 或 Python 中的内置运算符一样使用，让开发者能够轻松地直接在数据存储位置分析合同、PDF、笔录或图像。运行这些查询时，Databricks 会自动扩展后端 Claude 的容量，以处理从几行到数百万行的各种数据，确保快速可靠的结果，无需额外设置。

在安全性方面，Anthropic 声称 Opus 4.5 Thinking 比 Sonnet 4.5 Thinking、GPT-5.1 Thinking 或 Gemini 3 Pro Thinking 等模型更不容易受到提示注入攻击。