微闻

标签: 模型

  • OpenAI推出轻量版模型

    OpenAI推出轻量版模型

    OpenAI今日宣布推出深度研究轻量版,旨在扩大Plus、Team和Pro用户的使用范围并提高速率限制。该版本由o4-mini模型支持,能够提供接近标准版的智能水平,同时显著降低了运营成本。与标准版相比,轻量版的内容响应更为简洁,但依然保持了高质量和深度。

    目前,所有Plus、Team和Pro用户已自动获得对轻量版深度研究的使用权限。对于免费用户而言,该服务今日起正式开放。当标准版的使用额度耗尽后,系统将自动切换至轻量版继续响应查询。

    值得注意的是,企业及教育用户需在接下来的一周内完成访问权限的申请与激活。此次更新使OpenAI进一步优化了资源分配,为不同类型的用户提供更加灵活和高效的服务选择。

  • 阿里推出高性能模型

    阿里开源全新推理模型通义千问 QwQ-32B

    阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的LLMs评测榜LiveBench、谷歌等提出的指令遵循能力 IFEval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问 QwQ-32B 的得分均超越了DeepSeek- R1。

    —— Hugging Face、ModelScope

  • OpenAI旗舰模型开发面临困难

    OpenAI 的下一代旗舰模型开发落后于计划且成本高昂

    OpenAI 的新人工智能项目进度落后,而且花费巨大。该项目正式名称为 GPT-5,代号为 Orion,已筹备超过 18 个月,旨在成为 ChatGPT 技术的重大进步。知情人士说,微软曾预计在 2024 年中期左右看到新模型,但至今仍未完成。 OpenAI 已经进行了至少两次大规模训练,每次都需要数月来处理大量数据。知情人士说,每次都会出现新的问题,软件都无法达到研究人员所希望的结果。

    知情人士表示,Orion 的表现充其量比 OpenAI 目前的产品要好,但还不足以证明维持新模型运行的巨大成本是合理的。根据估计,为期六个月的训练运行仅在计算成本上就可能花费约 5 亿美元。OpenAI 面临的另一个问题是高质量的训练数据,之前的模型训练中互联网上的公开数据已经耗尽。而 OpenAI 的解决方案是从头开始创建数据,它正在雇佣人员编写新的软件代码或解决数学问题,以供 Orion 学习。OpenAI 还开始开发合人工智能创建的数据,以帮助训练 Orion。

    —— 华尔街日报