Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。
5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。
在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。
阅读量30324
发布时间 : 2025-05-27 14:06:34
本文是翻译文章,文章原作者 Mayank Parma,文章来源:bleepingcomputer
译文仅供参考,具体内容表达以及含义原文为准。
Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。
5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。
在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。
在测试中,Opus 4在需要集中努力和数千步的长期任务中提供了持续的性能。
Anthropic还声称其最新型号连续工作了7个小时。
Vibe编码公司Lovable在其“基于AI的基于提示的Web和应用程序构建器”工具中使用Claude,在升级到Claude 4之后也观察到了类似的改进。
在X的一篇文章中,Lovable表示,在部署Claude 4用于所有项目(包括旧项目)的项目创建和编辑后,它的错误减少了25%,整体速度提高了40%。
在另一篇文章中,Lovable创始人安东·奥西卡(Anton Osika)证实,“克劳德4只是抹去了大部分Lovable的错误”,同时特别提到了在氛围编码时的LLM语法错误。
虽然对克劳德4的看法仍然参差不齐,但我个人注意到,当我在研究Dart / Kotlin应用程序时,Claude 4确实会产生比Gemini更少的代码。
这取决于项目到项目和上下文,但在不需要更长上下文的项目中,克劳德4在我的测试中比双子座做得更好。
克劳德模型一直保持着“最擅长编码”的声誉,但最近谷歌的竞争激烈,谷歌发布了Gemini 2.5 Pro,有100万个上下文窗口。
与Claude 4或更老型号的20万个上下文窗口相比,Gemini 2.5的100万个上下文窗口确实给它带来了优势。但这并不一定意味着双子座2.5在编码方面比克劳德4更好。
两者都可以令人惊讶地出色,同时也很糟糕,这也归结为你如何进行快速工程。
混合模型总是很好,例如用于规划的o3或双子座和用于编码的Claude 4和Gemini。
2025-05-28 14:35:06
2025-05-28 14:25:30
2025-05-28 14:18:05
2025-05-28 14:05:13
2025-05-28 13:50:21
2025-05-28 14:35:06
2025-05-28 14:25:30
2025-05-28 14:18:05
2025-05-28 13:50:21
2025-05-28 13:47:24
2025-05-28 13:40:48
2025-05-28 13:26:03
发表评论
您还未登录,请先登录。
登录