标签：推理模型

谷歌推出新一代AI推理模型Gemini 2.5

谷歌推出新一代AI推理模型Gemini 2.5

近日，谷歌正式发布了最新的Gemini 2.5系列AI推理模型。这一更新版本在问答交互中引入了短暂的”思考”环节，以增强模型的推理能力。

作为此次升级的核心产品，Gemini 2.5 Pro Experimental于2月13日正式推出。这款多模态推理AI模型被谷歌称为目前最智能的AI系统之一。该模型已整合到Google AI Studio开发者平台和Gemini应用程序中，并向订阅其每月20美元” Gemini Advanced”计划的用户提供访问权限。

Gemini 2.5 Pro（代号为” nebula”）在复杂任务处理能力上实现了显著突破，尤其在衡量人类偏好的LMArena排行榜上展现出超越现有竞争对手的优势。这一进展使Gemini系列进一步巩固了其在AI领域的领先地位。

值得注意的是，此次发布的Gemini 2.5系列是对先前版本的重大改进。此前的Gemini 1.5 Pro已展示了从PDF文件中提取特定引述并进行推理的能力，而新版本则在此基础上实现了更复杂的多模态处理和生成能力，包括图像和音频内容的原生支持。

Gemini系列模型采用了与Gemma相同的前沿研究和技术架构。其中，20亿参数的Gemma 2模型可借助Ollama在本地运行推理，充分展现了Gemini技术生态的延展性。这一系列的技术创新进一步确立了谷歌在AI领域的创新地位，并为其开发者社区提供了强大的工具支持。

2025年3月26日
OpenAI 推出其推理模型 o1-pro 的 API，旨在为需要更高计算能力和更可靠回答的开发者提供服务。

OpenAI 推出了其推理模型 o1-pro 的 API，旨在为需要更高计算能力和更可靠回答的开发者提供服务。该模型在计算资源上投入了比 o1 更多，以期实现更深入的思考和更高质量的回答。

作为 OpenAI 产品家族中的一款新成员，o1-pro 的 API 目前仅向特定开发者开放，这些开发者在使用 OpenAI API 服务时已支付至少 5 美元。该模型的服务价格较高，单个输入/输出 token 的费用分别为 150 和 600 美元，这远高于常规 o1 模型的价格（分别约为当前模型的两倍和十倍）。

OpenAI 发言人解释道，推出这一 API 版本是为了为提供更优质服务做出投资。o1-pro 使用了比 o1 更多的计算能力，并通过这种投入来实现对复杂问题的更深入分析，从而为开发者带来更令人信服的答案。随着开发者社区对这一功能需求的增加，OpenAI 已很高兴将该 API 引入市场。

值得注意的是，o1-pro 的推出标志着 OpenAI 在 AI 模型和服务市场上的进一步扩展。这一决策反映了公司对其模型升级后的巨大潜力和市场需求的肯定。

2025年3月20日
OpenAI 发布更便宜的 o3-Mini 推理模型

OpenAI 发布更便宜的 o3-Mini 推理模型

人工智能公司 OpenAI 推出了一种新的轻量级人工智能模型，据称该模型能够进行类似人类的推理并在效率方面取得了进展。该模型于周五发布，名为 o3-mini，可免费使用。该公司于 12 月首次宣布了 o3-mini 计划，同时推出了功能更强大的版本 o3。这两种模型都旨在回答与编程、数学和科学等主题相关的复杂问题。OpenAI 周五表示，o3-mini 现在可通过其 ChatGPT 聊天机器人提供给免费用户和付费 ChatGPT Plus 用户以及订阅 Pro 和 Team 服务的用户使用。该模型也可通过该公司的应用程序编程接口 (API) 获得。该公司还表示，将在一周内向企业用户提供该模型。

—— 彭博社

2025年2月1日
开放AI发布新人工智能推理模型

OpenAI 发布推理模型 o3 和 o3-mini

周五，在“OpenAI 12天活动”的第12天，首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型，但今天将使这些模型可用于公共安全测试和研究。就像o1一样，o3是一个模型家族，o3-mini是一款更小的精简版模型，专门针对特定任务进行了微调。OpenAI声称，至少在某些条件下，o3可以接近实现AGI。OpenAI总裁Greg Brockman表示，最新的推理模型o3是一个突破，在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

—— 财联社、新浪财经、OpenAI

2025年1月3日
谷歌发布第一个人工智能推理模型

谷歌发布首个人工智能推理模型

当地时间12月19日，谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型，这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程，来解决复杂的问题，推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

—— 财联社、Techcrunch

2025年1月3日
OpenAI发布推理模型o3和o3-mini

OpenAI 发布推理模型 o3 和 o3-mini

周五，在“OpenAI 12天活动”的第12天，首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型，但今天将使这些模型可用于公共安全测试和研究。就像o1一样，o3是一个模型家族，o3-mini是一款更小的精简版模型，专门针对特定任务进行了微调。OpenAI声称，至少在某些条件下，o3可以接近实现AGI。OpenAI总裁Greg Brockman表示，最新的推理模型o3是一个突破，在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

—— 财联社、新浪财经、OpenAI

2025年1月3日
谷歌发布人工智能推理模型

谷歌发布首个人工智能推理模型

当地时间12月19日，谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型，这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程，来解决复杂的问题，推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

—— 财联社、Techcrunch

2025年1月3日
OpenAI发布推理模型o3和o3-mini

OpenAI 发布推理模型 o3 和 o3-mini

周五，在“OpenAI 12天活动”的第12天，首席执行官萨姆·奥尔特曼宣布了其最新的人工智能“推理”模型o3和o3-mini，这两款模型是在今年早些时候推出的o1模型的基础上开发的。该公司尚未发布这些模型，但今天将使这些模型可用于公共安全测试和研究。就像o1一样，o3是一个模型家族，o3-mini是一款更小的精简版模型，专门针对特定任务进行了微调。OpenAI声称，至少在某些条件下，o3可以接近实现AGI。OpenAI总裁Greg Brockman表示，最新的推理模型o3是一个突破，在最困难的基准上有了阶跃函数的改进。现在开始安全测试和红队演练。

—— 财联社、新浪财经、OpenAI

2024年12月26日
谷歌发布首个人工智能推理模型

谷歌发布首个人工智能推理模型

当地时间12月19日，谷歌发布实验性的“Gemini 2.0 Flash Thinking”模型，这是谷歌首个AI推理模型。该模型能明确展现自己的思考过程，来解决复杂的问题，推理能力更强。该模型目前已在Google AI Studio和Vertex AI平台上线。谷歌表示，这只是推理之旅的第一步，未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。

—— 财联社、Techcrunch

2024年12月26日
月之暗面的新一代数学推理模型发布

月之暗面发布新一代数学推理模型

月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示，Kimi k0-math的数学能力可对标OpenAI o1系列可公开使用的两个模型：o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。k0-math模型和Kimi探索版，未来几周将会分批上线Kimi网页版和Kimi智能助手APP。

—— 界面新闻

2024年12月5日

标签： 推理模型

标签：推理模型