首页

阅读

活动

社区

学院

安全导航

内容精选

Mistral 的 Mixtral 8x22B 创造了开源LLM的新记录

阅读量182095

发布时间 : 2024-04-18 11:21:10

法国人工智能初创公司 Mistral AI 推出了 Mixtral 8x22B，这是一种新的开源语言模型，该公司声称该模型实现了最高的开源性能和效率。

该模型是一个稀疏专家混合 (SMoE) 模型，仅主动使用 1,410 亿个参数中的 390 亿个参数。因此，开发团队声称，就其尺寸而言，它提供了非常好的性价比。其前身Mixtral 8x7B受到了开源社区的好评。

据 Mistral 介绍，Mixtral 8x22B 的优势包括多语言能力，支持英语、法语、意大利语、德语和西班牙语，以及强大的数学和编程能力。它还提供使用外部工具的本机函数调用。 64,000 个令牌的上下文窗口比当前领先的商业模型（例如GPT-4 (128K) 或Claude 3 (200K)）的上下文窗口要小。

开源无限制
Mistral 团队在 Apache 2.0 许可证下发布 Mixtral 8x22B，这是目前最宽松的开源许可证。它允许不受限制地使用模型。

Mistral 表示，该模型对活动参数的稀疏使用使其比传统的密集训练的 700 亿个参数模型更快，并且比其他开源模型更强大。

图片：米斯特拉尔人工智能

与其他开放模型相比，Mixtral 8x22B 在 MMLU、HellaSwag、Wino Grande、Arc Challenge、TriviaQA 和 NaturalQS 等流行的理解力、逻辑和知识测试中取得了最佳成绩。

在 HellaSwag、Arc Challenge 和 MMLU 基准测试中，它在支持的语言（法语、德语、西班牙语和意大利语）中的表现也明显优于 70B LLaMA-2 模型。

与其他开放模型相比，Mixtral 8x22B 在 MMLU、HellaSwag、Wino Grande、Arc Challenge、TriviaQA 和 NaturalQS 等流行的理解力、逻辑和知识测试中取得了最佳成绩。

在 HellaSwag、Arc Challenge 和 MMLU 基准测试中，它在支持的语言（法语、德语、西班牙语和意大利语）中的表现也明显优于 70B LLaMA-2 模型。

图片：米斯特拉尔人工智能

新模型现在可以在 Mistral 的“la Platforme”上进行测试。 Mistral 表示，开源版本可在 Hugging Face 上找到，并且是微调应用程序的一个很好的起点。该模型需要 258 GB 的 VRAM。

本文转载自:

如若转载,请注明出处： https://the-decoder.com/mistrals-mixtral-8x22b-sets-new-records-for-open-source-llms/

安全KER - 有思想的安全新媒体

分享到：

人工智能

8赞

收藏

安全客

分享到：

发表评论

这个人太懒了，签名都懒得写一个

文章
2096

粉丝
6

TA的文章

英国通过数据访问和使用监管法案
2025-06-20 17:11:10
CISA警告：严重缺陷（CVE-2025-5310）暴露加油站设备
2025-06-20 17:09:03
大多数公司高估了AI治理，因为隐私风险激增
2025-06-20 17:05:02
研究人员发现了有史以来最大的数据泄露事件，暴露了160亿个登录凭证
2025-06-20 17:02:15
CVE-2025-6018和CVE-2025-6019漏洞利用：链接本地特权升级缺陷让攻击者获得大多数Linux发行版的根访问权限
2025-06-20 16:59:36

相关文章

人工智能可能修复帮助传播了 15 年的漏洞
2025-06-12 15:19:33
浅析新型网络犯罪DeepSeek AI实战应用
2025-03-18 10:38:20
360SRC x Hacking Group丨「奇御」AI安全技术沙龙议题征集！
2024-11-28 17:43:31
从误用到滥用：人工智能风险与攻击
2024-10-17 11:00:07
一种用于网络钓鱼攻击的生成式人工智能恶意软件
2024-09-25 14:16:34
苹果加入美国政府对人工智能安全的自愿承诺
2024-07-31 11:23:56
Vanta筹集1.5亿美元，加速其AI产品创新
2024-07-25 15:02:41

热门推荐

文章目录

安全KER

商务合作

内容需知

投稿须知
转载须知
官网QQ群：568681302

合作单位

Copyright © 北京奇虎科技有限公司三六零数字安全科技集团有限公司安全KER All Rights Reserved 京ICP备08010314号-66