标签： o3模型

OpenAI o3 模型在性能和成本上的差异

OpenAI o3 模型表现出色的背后是高昂成本

ARC-AGI 基准测试的创建者弗朗索瓦·肖莱在博文中写道，OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破，但成本着实太高。根据 ARC-AGI 测试的性能图标，o3 的高分版本每项任务都使用了价值超过 1000 美元的计算资源，o1 模型每个任务使用约 5 美元的计算资源，而 o1-mini 仅使用几美分。这意味着 OpenAI 虽然获得了将近 88% 的高分，但却消耗了 170 多倍的计算资源，而高计算版本 o3 整个测试下来，调用资源成本超过 1 万美元。o3 这种具有扩展测试时间计算能力的人工智能模型似乎仅适用于重大战略决策，而非日常小问题，高昂的计算成本才值得。

—— TechCrunch

2025年1月3日
o3 模型取得突破性进展但经济性欠佳

OpenAI 的 o3 模型取得突破性进展但经济性欠佳

AGI 基准测试竞赛 Arc Prize 与 OpenAI 合作在 ARC-AGI 基准测试上对新推理模型 o3 进行了测试，其展示了 AI 适应新任务的重大突破。它在低计算模式下的半私有评估中得分为 75.7%，相较于上代模型提升了3倍，在高计算模式下得分为 87.5%，大幅领先于其他受试模型。

然而，这种通用性的成本很高，而且目前还不是很经济：让人类解决 ARC-AGI 任务仅需支付大约每项任务 5 美元的费用，同时仅消耗几美分的能源。而 o3 在低计算模式下每项任务需要 17-20 美元，在高计算模式中每个任务数千美元。此外，仍有相当多的非常简单的 ARC-AGI-1 任务是 o3 即使消耗了数百万 token 也无法解决的，而这些任务对于正常人类并不复杂。

—— Arc Prize

2025年1月3日
OpenAI o3 模型的高昂成本

OpenAI o3 模型表现出色的背后是高昂成本

ARC-AGI 基准测试的创建者弗朗索瓦·肖莱在博文中写道，OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破，但成本着实太高。根据 ARC-AGI 测试的性能图标，o3 的高分版本每项任务都使用了价值超过 1000 美元的计算资源，o1 模型每个任务使用约 5 美元的计算资源，而 o1-mini 仅使用几美分。这意味着 OpenAI 虽然获得了将近 88% 的高分，但却消耗了 170 多倍的计算资源，而高计算版本 o3 整个测试下来，调用资源成本超过 1 万美元。o3 这种具有扩展测试时间计算能力的人工智能模型似乎仅适用于重大战略决策，而非日常小问题，高昂的计算成本才值得。

—— TechCrunch

2025年1月3日
o3 模型取得突破性进展但经济性欠佳

OpenAI 的 o3 模型取得突破性进展但经济性欠佳

AGI 基准测试竞赛 Arc Prize 与 OpenAI 合作在 ARC-AGI 基准测试上对新推理模型 o3 进行了测试，其展示了 AI 适应新任务的重大突破。它在低计算模式下的半私有评估中得分为 75.7%，相较于上代模型提升了3倍，在高计算模式下得分为 87.5%，大幅领先于其他受试模型。

然而，这种通用性的成本很高，而且目前还不是很经济：让人类解决 ARC-AGI 任务仅需支付大约每项任务 5 美元的费用，同时仅消耗几美分的能源。而 o3 在低计算模式下每项任务需要 17-20 美元，在高计算模式中每个任务数千美元。此外，仍有相当多的非常简单的 ARC-AGI-1 任务是 o3 即使消耗了数百万 token 也无法解决的，而这些任务对于正常人类并不复杂。

—— Arc Prize

2025年1月3日
OpenAI o3 模型的高昂成本

OpenAI o3 模型表现出色的背后是高昂成本

ARC-AGI 基准测试的创建者弗朗索瓦·肖莱在博文中写道，OpenAI 的 o3 模型虽然是 AI 领域的一个重要突破，但成本着实太高。根据 ARC-AGI 测试的性能图标，o3 的高分版本每项任务都使用了价值超过 1000 美元的计算资源，o1 模型每个任务使用约 5 美元的计算资源，而 o1-mini 仅使用几美分。这意味着 OpenAI 虽然获得了将近 88% 的高分，但却消耗了 170 多倍的计算资源，而高计算版本 o3 整个测试下来，调用资源成本超过 1 万美元。o3 这种具有扩展测试时间计算能力的人工智能模型似乎仅适用于重大战略决策，而非日常小问题，高昂的计算成本才值得。

—— TechCrunch

2024年12月26日
o3 模型获得AI竞赛突破

OpenAI 的 o3 模型取得突破性进展但经济性欠佳

AGI 基准测试竞赛 Arc Prize 与 OpenAI 合作在 ARC-AGI 基准测试上对新推理模型 o3 进行了测试，其展示了 AI 适应新任务的重大突破。它在低计算模式下的半私有评估中得分为 75.7%，相较于上代模型提升了3倍，在高计算模式下得分为 87.5%，大幅领先于其他受试模型。

然而，这种通用性的成本很高，而且目前还不是很经济：让人类解决 ARC-AGI 任务仅需支付大约每项任务 5 美元的费用，同时仅消耗几美分的能源。而 o3 在低计算模式下每项任务需要 17-20 美元，在高计算模式中每个任务数千美元。此外，仍有相当多的非常简单的 ARC-AGI-1 任务是 o3 即使消耗了数百万 token 也无法解决的，而这些任务对于正常人类并不复杂。

—— Arc Prize

2024年12月26日

标签： o3模型

OpenAI o3 模型在性能和成本上的差异

o3 模型取得突破性进展但经济性欠佳

OpenAI o3 模型的高昂成本

o3 模型取得突破性进展但经济性欠佳

OpenAI o3 模型的高昂成本

o3 模型获得AI竞赛突破