微闻

阿里推出全新Qwen3系列大语言模型

今天,阿里通义千问宣布推出全新一代大型语言模型——Qwen3系列。该系列包括两个开源模型:旗舰级的2350多亿参数模型Qwen3-235B-A22B和轻量化设计的小型模型Qwen3-30B-A3B,分别具有220多亿激活参数和约300亿总参数。这些模型在代码处理、数学能力等关键基准测试中均展现出与顶级模型相媲美的性能表现。

值得注意的是,尽管小型的MoE(混合专家)模型Qwen3-4B仅有47亿参数,但其推理效率却显著提升,足以匹敌前代大型模型Qwen2.5-72B-Instruct的表现。这一突破性成果标志着阿里通义千问在大语言模型开发领域的技术实力进一步增强。

为推动开源社区的发展,阿里通义千问已将这两个MoE模型的权重以Apache 2.0许可协议公开共享。此举不仅体现了阿里巴巴对技术创新和开放合作的支持,也为开发者提供了更灵活的研究与应用选择。

更多文章