标签: 推理模型

  • OpenAI发布推理模型o3和o3-mini

    OpenAI 发布推理模型 o3 和 o3-mini

    周五,在“OpenAI 12天活动”的第12天,首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini,这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型,但今天将使这些模型可用于公共安全测试和研究。就像o1一样,o3是一个模型家族,o3-mini是一款更小的精简版模型,专门针对特定任务进行了微调。OpenAI声称,至少在某些条件下,o3可以接近实现AGI。OpenAI总裁Greg Brockman表示,最新的推理模型o3是一个突破,在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

    —— 财联社、新浪财经、OpenAI

  • 谷歌发布首个人工智能推理模型

    谷歌发布首个人工智能推理模型

    当地时间12月19日,谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型,这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程,来解决复杂的问题,推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示,这只是推理之旅的第一步,未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

    —— 财联社、Techcrunch

  • 月之暗面的新一代数学推理模型发布

    月之暗面发布新一代数学推理模型

    月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示,Kimi k0-math的数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型和Kimi探索版,未来几周将会分批上线Kimi网页版和Kimi智能助手APP。

    —— 界面新闻

  • OpenAI 预計將在兩周內發布下一代「草莓»推理模型

    OpenAI 预计将在两周内发布下一代“草莓”推理模型

    两位测试过该模型的人士表示,OpenAI 计划在未来两周内将“草莓” (Strawberry) 模型作为 ChatGPT 服务的一部分发布,这比最近报道的秋季时间表要早。虽然“草莓”是 ChatGPT 的一部分,但它是一个独立的产品。具体如何提供尚不清楚:一种可能是将“草莓”包含在客户可以选择的 AI 模型下拉菜单中,以支持 ChatGPT。知情人士说,它与常规服务截然不同,既有优点也有缺点。两位测试过该模型的人士表示,“草莓”与其他对话式 AI 最大的区别在于它能够在回应之前“思考”,而不是立即回答问题,思考阶段通常持续 10 到 20 秒。

    —— The Information