微闻

阿里开源推出全新多模态大语言模型Qwen2.5-VL-32B-Instruct

阿里开源推出全新多模态大语言模型——Qwen2.5-VL-32B-Instruct

在与深度求索DeepSeek-V3更新同步推出的同一夜,阿里通义千问团队宣布开源其最新研发的多模态大型语言模型:Qwen2.5-VL-32B-Instruct。这一新版本在原有Qwen2.5-VL系列基础上进行了重要优化,展现出显著的技术突破。

据官方介绍,相较于此前发布的同系列模型,此次推出的320亿参数规模的Qwen2.5-VL-32B-Instruct模型在多个维度实现了性能提升:

首先,在输出风格方面,该模型通过调整回复策略,使回答更加详细、格式更为规范,并更贴近人类的主观偏好。其次,在数学推理能力上,经过优化后的模型在解决复杂数学问题时准确率显著提高。此外,图像细粒度理解与推理能力也得到增强,展现出更强的图像解析、内容识别和视觉逻辑推导能力。

值得注意的是,尽管该模型仅有320亿参数规模,但在各项测试中却展现出超越更大规模的Qwen2-VL-72B-Instruct模型的表现。这表明,通过针对性优化而非一味追求参数规模,同样能够实现显著的技术突破。

目前,QwenLM团队已将这一全新模型及其不同尺寸版本(包括0.5B、1.5B、3B、7B、14B、32B和72B)开源发布,为研究者和开发者提供了丰富的选择空间。

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注