阿里Qwen 2.5-Max超大规模MoE模型发布

作者：

在

1月29日凌晨，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型，企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步，下一个版本 Qwen2.5-Max 将会达到更高水平。

—— 通义千问

Qwen 2.5-Max 阿里

阿里Qwen 2.5-Max超大规模MoE模型发布

更多文章

Spotify推出新功能绕过苹果30%佣金

“欧盟与美国就减少关税达成协议”

TikTok在澳大利亚市场展现强劲增长

标题：Temu应对美国市场调整措施

Waymo自动驾驶展现卓越安全性能

英伟达担忧华为AI芯片竞争实力

美国白宫宣布国家安全顾问迈克·沃尔茨被提名为驻联合国大使

通用汽车及汽车行业面临高额关税成本冲击

评论

发表回复取消回复

阿里Qwen 2.5-Max超大规模MoE模型发布

更多文章

评论

发表回复 取消回复

发表回复取消回复