OpenAI CTO 表示她不知道 Sora 的训练数据来自哪里
人工智能公司 OpenAI 的首席技术官米拉·穆拉蒂本周与《华尔街日报》的乔安娜·斯特恩坐下来讨论了该公司即将推出的视频生成人工智能 Sora。10分钟的采访进行到一半时,斯特恩直截了当地问穆拉蒂新模型的训练数据是从哪里收集的。但穆拉蒂目光闪烁以模糊的公司语言回答了这个问题。“我们使用了公开数据和许可数据,”穆拉蒂回答了这个极其简单的问题。斯特恩用更具体的来源示例反驳道:“那么,YouTube 上的视频?”“你知道,如果它们是公开可用的——公开可用,”首席技术官回答道,“但我不确定。我对此没有信心。”随后,斯特恩询问了 OpenAI 与 Shutterstock 的数据训练合作情况,询问是否被纳入了 Sora 的训练材料中。“关于使用数据的细节,我是不会详细说的,”穆拉蒂继续说道。“但我们用的数据肯定是公开的,或者许可使用的。”
—— 华尔街日报