苹果、英伟达等公司未经许可使用 YouTube 字幕文件来训练人工智能模型
Proof News 调查显示,一些全球最大的科技公司未经许可在包含超过 17.3 万个 YouTube 视频字幕文件的数据集上训练了他们的人工智能模型。该数据集由名为 EleutherAI 的非营利公司创建,包含来自 4.8 万多个频道的 YouTube 视频字幕文件,并被苹果、英伟达和 Anthropic 等公司使用。影响到的创作者包括 Marques Brownlee 和 MrBeast,以及纽约时报、BBC 和 ABC News 等大型新闻出版商。谷歌发言人表示, YouTube 首席执行官尼尔·莫汉之前的评论仍然有效,即使用 YouTube 数据训练人工智能模型的公司将违反该平台的条款和服务。
—— Engadget