Anthropic 的 Claude 3 取代 OpenAI 的 GPT-4 成为最受欢迎的用户评价 LLM

阅读量70614

发布时间 : 2024-03-28 11:28:49

Anthropic 的 Claude 3 Opus 首次击败了 OpenAI 的 GPT-4,登上了聊天机器人排行榜的榜首。

根据 Chatbot Arena 排行榜,Anthropic 的 Claude 3 Opus首次超越 OpenAI 的GPT-4夺得榜首。根据真实人们对聊天机器人技能的评价,Claude 3 Opus现在排名第一。 GPT-4 已被推至第二位。

Chatbot Arena 是大型模型系统组织 (LMSYS) 创建的一个基准平台,用于比较大型语言模型的性能。竞技场让不同的模型在秘密、随机的战斗中相互对抗。用户对模型进行评分并投票选出他们最喜欢的答案。这使得排名非常有用,因为它们是基于用户偏好的。

这是自 GPT-4 发布约一年以来,第一次有另一种语言模型在聊天机器人领域击败了 GPT-4。更令人印象深刻的是,便宜得多的 Anthropic Haiku模型接近 GPT-4。

Haiku 好多了,特别是在生成文本方面,当你给它很多例子时,它的成本比 GPT-4 低十倍左右,并且与 2023 年 3 月的第一个 GPT-4 版本 0314 一样好,如果 LMSys 人群是正确的。 Anthropic 的中频 Sonnet 也击败了原来的 GPT-4。

图片:LMsys(截图 27/03/24)

由于 Claude 3 Opus,OpenAI 的领先地位正在下滑,这在最近几个月并不明显,尤其是在谷歌发布的 Gemini 几乎没有给人留下深刻印象的情况下。但 OpenAI 仍然以其模型占领市场,尤其是针对普通用户的ChatGPT。

然而,Anthropic 可能会在 API 使用方面迅速赶上。 OpenAI 领导层最近的变化已经向 Anthropic表明,他们不想只依赖一家人工智能公司,这对 Anthropic 有所帮助。

OpenAI 可能很快就会反击:泄密表明该公司最早可能在今年夏天推出一种“更智能”的模型,可能是 GPT-4.5或 GPT-5。 OpenAI 首席执行官 Sam Altman 证实,他的公司打算今年推出一个“令人惊叹的”AI 模型。

本文转载自:

如若转载,请注明出处: https://the-decoder.com/anthropics-claude-3-replaces-openais-gpt-4-as-most-popular-user-rated-llm/

安全客 - 有思想的安全新媒体

分享到:微信
+13赞
收藏
安全客
分享到:微信

发表评论

内容需知
  • 投稿须知
  • 转载须知
  • 官网QQ群8:819797106
  • 官网QQ群3:830462644(已满)
  • 官网QQ群2:814450983(已满)
  • 官网QQ群1:702511263(已满)
合作单位
  • 安全客
  • 安全客
Copyright © 北京奇虎科技有限公司 360网络攻防实验室 安全客 All Rights Reserved 京ICP备08010314号-66