Anthropic 推出 Claude Haiku 4.5

场长

动态 0 1381 2025-10-16 10:32:12

导读：Anthropic 10月15号推出了 Claude Haiku 4.5。它是 Anthropic 中最小、最快与价格最实惠的型号，但性能与 Sonnet 4 相当。

各位开发者们注意了！人工智能公司Anthropic 于10月15号推出了其 Claude Haiku 型号的最新版本 Haiku 4.5，这是该系列中最小、最快与价格最实惠的型号。

近几个月来，Anthropic 发布了一系列新型号，首先是5 月份发布的 Sonnet 4 和 Opus 4，接着是 Opus 4.1，以及几周前发布的Sonnet 4.5。最新一代型号缺少 Haiku，而 Haiku 始终是在价格、速度和模型智能之间提供合理的平衡。

上一代 Haiku 3.5 版本于去年年底发布，Anthropic 好像忘记了其家族型号的这一功能。

Haiku 4.5 的特别之处在于，它在很多方面都与六个月前推出的 Claude Sonnet 4 不相上下，堪称当时最先进的模型。Anthropic 认为，这使得 Haiku 4.5 成为一个特别有趣的模型，对于那些希望在多智能体系统中使用它的人来说，Sonnet 会将任务分包给基于 Haiku 4.5 的子智能体。

这家公司对 Haiku 4.5 的性能非常充满信心，并将随机选择部分用户，将其作为 Claude.ai 服务的默认操作系统。现在，所有用户都可以从模型选择器中选择 Haiku 4.5。

Haiku 4.5 的定价为每百万输入令牌 1 美元，每百万输出令牌 5 美元。而 Haiku 3.5 的定价为每百万输入/输出令牌 0.80 美元/4 美元。

Claude Haiku 4.5 版本现已在 Claude.ai 以及 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上推出。

基准测试数据

图片来源：Anthropic

在 Anthropic 发布的基准测试中，Haiku 4.5 与 Sonnet 4 相比毫不逊色，在很多情况下，甚至与谷歌的 Gemini 2.5 和 OpenAI 的 GPT-5 相比也不逊色。在 Anthropic 模型历来强势的领域，包括编码和工具使用上，尤其如此。

在某些领域，包括计算机使用和 SWE 基准（测试模型解决一组 GitHub 问题的能力），Haiku 4.5 实际上超越了 Sonnet 4。

Haiku 4.5 本质是一种混合推理模型，具有可选的“扩展思维模式”，这是 Haiku 系列的首创。

图片来源：Anthropic

Haiku 4.5 的上下文窗口将保持在 20万个令牌，但 Claude 开发者平台上的用户将能够访问 100 万个令牌的上下文窗口。

但在现实世界的聊天使用中，大多数用户并不会发现 Sonnet 和 Haiku 之间有什么重大区别。

Windsurf 首席执行官 Jeff Want 表示道：“从历史上看，模型通常会为了质量而牺牲速度和成本。Haiku 4.5 正在模糊这种权衡的界限：它是一款快速前沿模型，既保持了成本效益，又预示了此类模型的发展方向。”

为何花了这么长时间？

当我询问 Anthropic 开发者关系主管亚历克斯·阿尔伯特 (Alex Albert) 为什么新车型的发布花了这么长时间时，他指出，该公司去年的重点是改进其前沿模型。

“Anthropic 做得非常好的一点是，它始终专注于眼前的目标，不会试图同时做太多事情，而是真正地实现我们既定的目标，”Albert 说。“但现在，我认为情况有所转变。随着 Sonnet 4.5 的发布，我们在前沿领域又迈出了一大步，现在的关键在于，我们如何才能真正解锁更多用例，让不同类型的应用程序能够与前沿技术完美匹配。”

图片来源：Anthropic

Haiku 多智能体系统

Anthropic 的目标用例是使用 Haiku 在多智能体系统中构建快速、特定任务的子智能体。事实上，Anthropic 广受欢迎的编码智能体 Claude Code 即将开始实现这一目标。对于这些系统，Sonnet 4.5 可以提供指导，而 Haiku 4.5 负责执行（Albert 强调，Haiku 4.5 本身在工具调用方面也相当出色）。由于任务的范围和方向明确（而且由于许多子智能体可以并行运行，因此速度至关重要），因此性能方面不会有太大的妥协。

“我对这种思考智能水平的概念感到非常兴奋。所以，如果你考虑 Sonnet 4 的智能水平，那么 Haiku 4.5 就恰好处于这个水平，甚至在某些方面略高一些。而且现在价格在五个月内下降了三倍，”Alber 告诉我，他指的是 Sonnet 4 和 Haiku 4.5 之间的价格差异。“我认为这是一个非常棒的故事，它讲述了特定智能水平的模型如何随着时间的推移而变得更便宜。这是过去几年人工智能的前景。能够以切实的方式看到这一点对我来说非常酷，我认为开发人员一定会喜欢的。”

Claude Opus 4.1 曾被认为是 Anthropic 的旗舰模型，目前在 Claude.ai 的模型选择器中被列为“旧版头脑风暴模型”。Albert 表示，有些用户更喜欢它，但他现在建议所有人都使用 Sonnet 4.5。