开放源代码促进会:开源 AI 必须披露其训练数据
开放源代码促进会 (OSI) 发布了“Open”人工智能的官方定义。OSI 长期以来一直为开源软件的构成设定行业标准,但人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使AI系统被视为真正的开源系统,必须提供:可访问用于训练AI的数据的详细信息,以便其他人可以理解和重新创建;用于构建和运行AI的完整代码;训练中的设置和权重,帮助AI产生相应的结果。
该定义直接挑战了 Meta 的 Llama,后者被广泛宣传为最大的开源 AI 模型。Llama 可供公众下载和使用,但其商业用途受到限制。且不提供对训练数据的访问,这导致其不符合 OSI 的无限制使用、修改和共享自由标准。
—— TheVerge