OpenAIE及 FrontierMath事件引发质疑

AI 基准测试组织因未及时披露 OpenAI 资金而引发质疑

非营利组织 Epoch AI 于 12 月 20 日透露,OpenAI 通过资金支持创建了 FrontierMath。这是一项旨在衡量人工智能数学技能的专家级问题测试,是 OpenAI 用来演示其旗舰模型 o3 的基准之一。这引起了 AI 社区中对其不当行为指控,许多基准的贡献者直到 OpenAI 的参与被公开后才获悉。之少六位对基准做出重大贡献的数学家证实,他们不知道 OpenAI 将拥有该基准的独家访问权,并表示如果获知可能不会参与项目。

Epoch AI 副总监兼联合创始人 Tamay Besiroglu 坚称 FrontierMath 的完整性没有受到损害,但承认在不提高透明度方面“犯了一个错误”。他表示,“直到 o3 发布时,我们才被解禁披露合作关系,事后看来,我们应该更努力地进行谈判,以便尽快向基准贡献者透明化。我们的数学家应该知道谁可以访问他们的工作。尽管在合同上限制了我们能说什么,但我们应该把对贡献者的透明度作为我们与 OpenAI 协议中不可协商的一部分。”

—— TechCrunch

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注