Anthropic 的 Claude 3 取代 OpenAI 的 GPT-4 成为最受欢迎的用户评价 LLM-安全KER

Anthropic 的 Claude 3 取代 OpenAI 的 GPT-4 成为最受欢迎的用户评价 LLM

阅读量160295

发布时间 : 2024-03-28 11:28:49

Anthropic 的 Claude 3 Opus 首次击败了 OpenAI 的 GPT-4，登上了聊天机器人排行榜的榜首。

根据 Chatbot Arena 排行榜，Anthropic 的 Claude 3 Opus首次超越 OpenAI 的GPT-4夺得榜首。根据真实人们对聊天机器人技能的评价，Claude 3 Opus现在排名第一。 GPT-4 已被推至第二位。

Chatbot Arena 是大型模型系统组织 (LMSYS) 创建的一个基准平台，用于比较大型语言模型的性能。竞技场让不同的模型在秘密、随机的战斗中相互对抗。用户对模型进行评分并投票选出他们最喜欢的答案。这使得排名非常有用，因为它们是基于用户偏好的。

这是自 GPT-4 发布约一年以来，第一次有另一种语言模型在聊天机器人领域击败了 GPT-4。更令人印象深刻的是，便宜得多的 Anthropic Haiku模型接近 GPT-4。

Haiku 好多了，特别是在生成文本方面，当你给它很多例子时，它的成本比 GPT-4 低十倍左右，并且与 2023 年 3 月的第一个 GPT-4 版本 0314 一样好，如果 LMSys 人群是正确的。 Anthropic 的中频 Sonnet 也击败了原来的 GPT-4。

图片：LMsys（截图 27/03/24）

由于 Claude 3 Opus，OpenAI 的领先地位正在下滑，这在最近几个月并不明显，尤其是在谷歌发布的 Gemini 几乎没有给人留下深刻印象的情况下。但 OpenAI 仍然以其模型占领市场，尤其是针对普通用户的ChatGPT。

然而，Anthropic 可能会在 API 使用方面迅速赶上。 OpenAI 领导层最近的变化已经向 Anthropic表明，他们不想只依赖一家人工智能公司，这对 Anthropic 有所帮助。

OpenAI 可能很快就会反击：泄密表明该公司最早可能在今年夏天推出一种“更智能”的模型，可能是 GPT-4.5或 GPT-5。 OpenAI 首席执行官 Sam Altman 证实，他的公司打算今年推出一个“令人惊叹的”AI 模型。

分享到：

4赞

安全客

分享到：

Anthropic 的 Claude 3 取代 OpenAI 的 GPT-4 成为最受欢迎的用户评价 LLM