Vibe编程公司表示，Claude 4将语法错误减少了25%。-安全KER

Vibe编程公司表示，Claude 4将语法错误减少了25%。

阅读量68357

发布时间 : 2025-05-27 14:06:34

克劳德

Lovable是一个Vibe编码工具,它说Claude 4已经将其错误减少了25%,并使其更快了40%。

5月22日,Anthropic开始推出两款新车型:Claude Sonnet 4和Claude Opus 4。虽然Sonnet可供免费用户使用,但Opus需要付费订阅,并且在编码方面能够比Sonnet做得更好。

在一篇博客文章中,Anthropic证实Claude Opus 4在SWE板凳上得分为72.5%(SWE是软件工程基准的缩写)。

克劳德 4

在测试中,Opus 4在需要集中努力和数千步的长期任务中提供了持续的性能。

Anthropic还声称其最新型号连续工作了7个小时。

Vibe编码公司Lovable在其“基于AI的基于提示的Web和应用程序构建器”工具中使用Claude,在升级到Claude 4之后也观察到了类似的改进。

在X的一篇文章中,Lovable表示,在部署Claude 4用于所有项目(包括旧项目)的项目创建和编辑后,它的错误减少了25%,整体速度提高了40%。

在另一篇文章中,Lovable创始人安东·奥西卡(Anton Osika)证实,“克劳德4只是抹去了大部分Lovable的错误”,同时特别提到了在氛围编码时的LLM语法错误。

克劳德4是编码的好模型

虽然对克劳德4的看法仍然参差不齐,但我个人注意到,当我在研究Dart / Kotlin应用程序时,Claude 4确实会产生比Gemini更少的代码。

这取决于项目到项目和上下文,但在不需要更长上下文的项目中,克劳德4在我的测试中比双子座做得更好。

克劳德模型一直保持着“最擅长编码”的声誉,但最近谷歌的竞争激烈,谷歌发布了Gemini 2.5 Pro,有100万个上下文窗口。

与Claude 4或更老型号的20万个上下文窗口相比,Gemini 2.5的100万个上下文窗口确实给它带来了优势。但这并不一定意味着双子座2.5在编码方面比克劳德4更好。

两者都可以令人惊讶地出色,同时也很糟糕,这也归结为你如何进行快速工程。

混合模型总是很好,例如用于规划的o3或双子座和用于编码的Claude 4和Gemini。

本文翻译自bleepingcomputer 原文链接。如若转载请注明出处。

分享到：

0赞

安全客

分享到：