+8613426109659
webmaster@21cto.com

Anthropic 推出 Claude Haiku 4.5

资讯 0 31 13小时前

图片

导读:Anthropic 10月15号推出了 Claude Haiku 4.5。它是 Anthropic 中最小、最快与价格最实惠的型号,但性能与 Sonnet 4 相当。

各位开发者们注意了!人工智能公司Anthropic 于10月15号推出了其 Claude Haiku 型号的最新版本 Haiku 4.5,这是该系列中最小、最快与价格最实惠的型号。

近几个月来,Anthropic 发布了一系列新型号,首先是5 月份发布的 Sonnet 4 和 Opus 4,接着是 Opus 4.1,以及几周前发布的Sonnet 4.5。最新一代型号缺少 Haiku,而 Haiku 始终是在价格、速度和模型智能之间提供合理的平衡。

上一代 Haiku 3.5 版本于去年年底发布,Anthropic 好像忘记了其家族型号的这一功能。

Haiku 4.5 的特别之处在于,它在很多方面都与六个月前推出的 Claude Sonnet 4 不相上下,堪称当时最先进的模型。Anthropic 认为,这使得 Haiku 4.5 成为一个特别有趣的模型,对于那些希望在多智能体系统中使用它的人来说,Sonnet 会将任务分包给基于 Haiku 4.5 的子智能体。

这家公司对 Haiku 4.5 的性能非常充满信心,并将随机选择部分用户,将其作为 Claude.ai 服务的默认操作系统。现在,所有用户都可以从模型选择器中选择 Haiku 4.5。

Haiku 4.5 的定价为每百万输入令牌 1 美元,每百万输出令牌 5 美元。而 Haiku 3.5 的定价为每百万输入/输出令牌 0.80 美元/4 美元。

Claude Haiku 4.5 版本现已在 Claude.ai 以及 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上推出。

基准测试数据


Claude Haiku 4.5 基准测试

图片来源:Anthropic

在 Anthropic 发布的基准测试中,Haiku 4.5 与 Sonnet 4 相比毫不逊色,在很多情况下,甚至与谷歌的 Gemini 2.5 和 OpenAI 的 GPT-5 相比也不逊色。在 Anthropic 模型历来强势的领域,包括编码和工具使用上,尤其如此。

在某些领域,包括计算机使用和 SWE 基准(测试模型解决一组 GitHub 问题的能力),Haiku 4.5 实际上超越了 Sonnet 4。

Haiku 4.5 本质是一种混合推理模型,具有可选的“扩展思维模式”,这是 Haiku 系列的首创。

Claude Haiku 在 SWE 基准上的表现

图片来源:Anthropic

Haiku 4.5 的上下文窗口将保持在 20万个令牌,但 Claude 开发者平台上的用户将能够访问 100 万个令牌的上下文窗口。

但在现实世界的聊天使用中,大多数用户并不会发现 Sonnet 和 Haiku 之间有什么重大区别。

Windsurf 首席执行官 Jeff Want 表示道:“从历史上看,模型通常会为了质量而牺牲速度和成本。Haiku 4.5 正在模糊这种权衡的界限:它是一款快速前沿模型,既保持了成本效益,又预示了此类模型的发展方向。”

为何花了这么长时间?


当我询问 Anthropic 开发者关系主管亚历克斯·阿尔伯特 (Alex Albert) 为什么新车型的发布花了这么长时间时,他指出,该公司去年的重点是改进其前沿模型。

“Anthropic 做得非常好的一点是,它始终专注于眼前的目标,不会试图同时做太多事情,而是真正地实现我们既定的目标,”Albert 说。“但现在,我认为情况有所转变。随着 Sonnet 4.5 的发布,我们在前沿领域又迈出了一大步,现在的关键在于,我们如何才能真正解锁更多用例,让不同类型的应用程序能够与前沿技术完美匹配。”

图片

图片来源:Anthropic

Haiku 多智能体系统


Anthropic 的目标用例是使用 Haiku 在多智能体系统中构建快速、特定任务的子智能体。事实上,Anthropic 广受欢迎的编码智能体 Claude Code 即将开始实现这一目标。对于这些系统,Sonnet 4.5 可以提供指导,而 Haiku 4.5 负责执行(Albert 强调,Haiku 4.5 本身在工具调用方面也相当出色)。由于任务的范围和方向明确(而且由于许多子智能体可以并行运行,因此速度至关重要),因此性能方面不会有太大的妥协。

“我对这种思考智能水平的概念感到非常兴奋。所以,如果你考虑 Sonnet 4 的智能水平,那么 Haiku 4.5 就恰好处于这个水平,甚至在某些方面略高一些。而且现在价格在五个月内下降了三倍,”Alber 告诉我,他指的是 Sonnet 4 和 Haiku 4.5 之间的价格差异。“我认为这是一个非常棒的故事,它讲述了特定智能水平的模型如何随着时间的推移而变得更便宜。这是过去几年人工智能的前景。能够以切实的方式看到这一点对我来说非常酷,我认为开发人员一定会喜欢的。”

Claude Opus 4.1 曾被认为是 Anthropic 的旗舰模型,目前在 Claude.ai 的模型选择器中被列为“旧版头脑风暴模型”。Albert 表示,有些用户更喜欢它,但他现在建议所有人都使用 Sonnet 4.5。

作者:洛逸

评论

我要赞赏作者

请扫描二维码,使用微信支付哦。