标签: 通义

  • 阿里云通义推出新开源人工智能模型QwQ

    阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1

    11月28日,阿里云通义团队发布全新人工智能推理模型QwQ-32B-Preview,并同步开源。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。QwQ (Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的人工智能推理模型。阿里云通义千问团队研究发现,当模型有足够的时间思考、质疑和反思时,其对数学和编程的理解就会深化。基于此,QwQ取得了解决复杂问题的突破性进展。

    —— 阿里巴巴

  • 阿里通义前核心员工被诉违反竞业协议

    阿里通义大模型前核心员工加入字节 被诉违反竞业协议

    今日,有消息称阿里通义大模型前员工周畅违反竞业协议,阿里方面已起诉递交劳动争议仲裁申请书。据接近通义的业内人士对科创板日报记者表示:情况属实。公开资料显示,周畅2017年博士毕业于北京大学计算机软件与理论专业,随后加入阿里巴巴,曾担任阿里通义大模型技术负责人,和团队推出一系列语言模型、多模态模型。今年7月周畅离职后,有媒体报道称,周畅已于8月加入字节,从事人工智能大模型相关工作。

    —— 科创板日报

  • 阿里通义千问 Qwen2 大模型发布

    阿里通义千问 Qwen2 大模型发布

    阿里通义千问 Qwen2 大模型发布并同步开源

    阿里通义千问 Qwen2 大模型今日发布,并在 Hugging Face 和 ModelScope 上同步开源。据悉,Qwen2 系列涵盖5个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B,上下文长度支持进一步扩展,最高达128K tokens。

    —— Qwen2