```Claude Sonnet 5 – 基准测试结果```
Claude Sonnet 5 – benchmark results

原始链接: https://artificialanalysis.ai/models/claude-sonnet-5

Claude Sonnet 5(自适应推理,最高效能)在智能方面处于领先地位,且与同价位模型相比性价比极高。该模型支持文本和图像输入,输出文本,并拥有 100 万 token 的上下文窗口。 Claude Sonnet 5(自适应推理,最高效能)在 Artificial Analysis 智能指数上得分为 53 分,远高于同类模型(平均分为 8 分)的平均水平。在进行智能指数评估时,它生成了 3 亿个 token,与 3700 万的平均值相比,输出非常详尽。 Claude Sonnet 5(自适应推理,最高效能)的定价为每 100 万输入 token 0.00 美元(定价具有竞争力,平均水平:0.00 美元),每 100 万输出 token 0.00 美元(定价具有竞争力,平均水平:0.00 美元)。

Hacker News 上关于 Claude 3.5 Sonnet 在 Artificial Analysis 最新基准测试结果的讨论大多持批评态度。用户认为该模型在高级推理水平上效率极低,相较于 GPT-4o 等竞争对手,消耗了过多的 token,而 GPT-4o 依然是 token 效率的标杆。 多位评论者表示失望,称该模型“平庸”,并指出在更高设置下性能的提升不足以抵消其增加的 token 成本。此外,人们对数据呈现方式也提出了技术性质疑;批评者指出图表不一致且缺失信息,甚至有人调侃称该报告质量低劣是否源于模型自身的幻觉。总的来说,社区对此并不买账,认为该模型既落后于顶尖的闭源竞争对手,也逊色于新兴的开源模型。
相关文章

原文

Claude Sonnet 5 (Adaptive Reasoning, Max Effort) is amongst the leading models in intelligence and well priced when comparing to other models of similar price. The model supports text and image input, outputs text, and has a 1m tokens context window.

Claude Sonnet 5 (Adaptive Reasoning, Max Effort) scores 53 on the Artificial Analysis Intelligence Index, placing it well above average among comparable models (averaging 8). When evaluating the Intelligence Index, it generated 300M tokens, which is very verbose in comparison to the average of 37M.

Pricing for Claude Sonnet 5 (Adaptive Reasoning, Max Effort) is $0.00 per 1M input tokens (competitively priced, average: $0.00) and $0.00 per 1M output tokens (competitively priced, average: $0.00).

联系我们 contact @ memedata.com