Anthropic 性价比最高 AI 模型:Haiku 4.5 登场,1/3 价格实现 Sonnet 4 同级编程能力

感谢网友 软媒用户1392612 的线索投递!

10 月 16 日消息,Anthropic 官网今天(10 月 16 日)发布博文,宣布推出小型 AI 模型 Claude Haiku 4.5。官方表示该模型以极低的成本提供了接近前沿模型的强大性能,目标成为实时、低延迟任务(如聊天助手和客户服务)的理想选择。

简单介绍下 Anthropic Claude 系列模型的三种尺寸规模:Haiku(小型)、Sonnet(中型)和 Opus(大型)。较大的模型基于更大的神经网络,通常包含更深层次的上下文知识,但运行速度较慢且成本更高。

而 Haiku 系列模型通常通过“蒸馏”技术,构建出规模较小的 AI 模型,让其在编码等功能性任务中达到大型、老旧模型的性能。

在应用场景方面,Anthropic 表示,Haiku 4.5 能够完美结合高智能与惊人的处理速度,满足用户对即时反馈的需求,专门针对实时聊天助手、在线客户服务代理以及辅助编程工具等需要高响应速度的应用场景设计。

在性能方面,Claude Haiku 4.5 编码性能与 Sonnet 4 基本持平,但在成本上仅为后者的三分之一,处理速度则提升了超过两倍。

援引博文介绍,在衡量编程能力的权威基准测试 SWE-bench Verified 中,Haiku 4.5 取得了 73.3% 的高分,略微领先于 Sonnet 4 的 72.7%。

根据 Anthropic 提供的内部基准数据,该模型在某些特定任务(如模拟人类使用计算机进行操作)上的表现也已超越 Sonnet 4。

更令人惊讶的是,在部分基准测试中,Haiku 4.5 的表现已十分接近 OpenAI 的 GPT-5 模型,不过官方也提醒,这些自报数据可能经过筛选,应审慎看待。

定价方面,Haiku 4.5 展现出巨大的市场竞争力。对于 Claude 网页端和 App 的订阅用户,该模型已包含在服务内。而对于开发者,其 API 调用价格设定为每百万输入 token 1 美元,每百万输出 token 5 美元。

作为对比,同系列的 Sonnet 4.5 模型定价为 3/15 美元,而更高阶的 Opus 4.1 则高达 15/75 美元,让 Haiku 4.5 成为旧版 Haiku 3.5 和 Sonnet 4 的高性价比直接替代品。

更重要的是,Anthropic 还为 Haiku 4.5 设计了创新的多模型协同工作流。在该模式下,更强大的 Sonnet 4.5 模型负责将一个复杂的总任务分解为多个步骤清晰的子计划,然后调度多个 Haiku 4.5 实例并行执行这些子任务。这种架构类似于一个项目经理带领多个高效的执行者协同工作,能够以更高效率和更低成本解决复杂问题,为 AI 代理式编码等高级应用场景开辟了新的可能性。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平